jueves, 27 de marzo de 2008

CODIFICACION
La codificación de caracteres es el método que permite convertir un carácter de un lenguaje natural (alfabeto o silabario) en un símbolo en otro sistema de representación, como un número o una secuencia de pulsos eléctricos en un sistema electrónico, aplicando normas o reglas de codificación
EL DIAGRAMA DE TALLO Y HOJA

Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.

Ejemplo
La siguiente distribución de frecuencia muestra el número de anuncios comerciales pagados por los 45 miembros de Greater Buffalo Automobile Dealer´s Association en 1999. Observemos que 7 de los 45 comerciantes pagaron entre 90 y 99 anuncios (pero menos de 100). Sin embargo, ¿El numero de comerciantes pagados en esta clase se agrupan en alrededor de 90, están dispersos a lo largo de toda clase, o se acumulan alrededor de 99? No podemos saberlo.

# De anuncios comprados Frecuencia
80 a 90 2
90 a 100 7
100 a 110 6
110 a 120 9
120 a 130 8
130 a 140 7
140 a 150 3
150 a 160 3
Total 45


Una técnica que se usa para presentar información cuantitativa en forma condensada es el diagrama de tallo y hoja. En el ejemplo anterior no podíamos la identidad de los valores de la clase de 90 a 100. Para ilustrar la construcción de un diagrama de tallo y hojas usando el número de comerciales comprados, supongamos que las 7 observaciones en la clase de 90 a 100 sean 96, 94, 93, 94, 95, 96, 97. EL valor de tallo es el digito o dígitos principales, en este caso el 9. Las hojas son los dígitos secundarios. EL tallo se coloca a la izquierda de una línea vertical y los valores de las hojas a la derecha.

Medidas de Dispersión
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. A) El desvío estándarEs posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media.
Los valores de las clases de 90 a 100, aparecerían como sigue:9 6 4 3 4 5 6 7 Por ultimo, ordenamos los valores dentro de cada tallo de menor a mayor. El segundo renglón del diagrama de tallo y hojas aparecería como sigue:9 3 4 4 5 6 6 7 Con el diagrama de tallo y hojas podemos observar rápidamente que hubo 2 comerciantes que compraron 94 comerciales y que el número de anuncios comprados fue desde 93 hasta 97. Un diagrama de tallo y hojas es semejante a una distribución de frecuencia, pero con más información, esto es, valores de datos en lugar de marcas.

F) Rango intercuartílico:El rango intercuartílico RI es, sencillamente, la diferencia entre el tercer y el primer cuartil, es decir

sábado, 8 de marzo de 2008

VARIABLE:
Una variable es un simbolo que representa un elemento no especificado de un conjunto dado. Dicho conjunto es llamado conjunto universal de la variable o universo de la variable, y cada eLas variables pueden ser cualitativas o cuantitativas.

VARIABLES CUALITATIVAS: aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos) y sólo pueden ser nominales u ordinales.

variables nominales: lo único que puede hacerse es establecer frecuencias en cada atributo y la igualdad o desigualdad entre los diferentes casos, ver cuál es el grupo que tiene mayor frecuencia alcanzando el concepto de “moda” (y también obtener algunas medidas de asociación cuando se relacionan variables entre sí).

variables ordinales: recogen la idea de orden pero no tiene sentido realizar operaciones aritméticas con ellas (acuerdo o desacuerdo con un proyecto de ley) ya que no puede medirse distancia entre una categoría y otra. Se puede establecer aquí igualdad y desigualdad, y relaciones como mayor que, y menor que. Puede establecerse orden, pero no medirse distancia dentro de ese orden. La medida estadística de tendencia central más apropiada para estas escalas es la "mediana".lemento del conjunto es un valor de la variable.

VRIABLE CUANTITATIVA:Aquella que se puede medir y se expresa numéricamente. Estos números reciben el nombre de datos. Los caracteres cuantitativos son de dos tipos:
Discretos: toman un número determinado de valores.
Continuo: Pueden tomar cualquier valor comprendido entre dos valores dados. Estos datos se agrupan en intervalos.

MEDIDAS DE TENDENCIA CENTRAL

La Media Aritmética
La medida de tendencia central mas ampliamente usada es la media aritmética, usualmente abreviada como media.
La media aritmética de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n.
Propiedades de la media aritmética
1. Puede ser calculada en distribuciones con escala relativa e intervalar.
2. Todos los valores son incluidos en el cómputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy útil para comparar dos o más poblaciones.
5. Es la única medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

Moda
Es el dato que más se repiten en la cuenta. Si existen dos datos que se repite un numero igual de veces entonces el conjunto será bimodal. Ejemplo:
Numero de personas en distintas casas en una villa:
5-7-4-6-9-5-6-1-5-3-7
en este caso el numero que más se repite es 5 entonces la moda en este caso es 5.

Mediana
Definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él.
De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra.
Matemáticamente hablando la mediana sería: Me =n+1/2 , si n es impar --> Me será la observación central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente.