domingo, 20 de mayo de 2012

TIPOS DE FRECUENCIA


Frecuencia es una medida para indicar el número de repeticiones de cualquier fenómeno o suceso periódico en la unidad de tiempo. Para calcular la frecuencia de un evento, se contabilizan un número de ocurrencias de este teniendo en cuenta un intervalo temporal, luego estas repeticiones se dividen por el tiempo transcurrido.
La Frecuencia Absoluta expresa el número de veces que en total aparece un determinado resultado dentro de una Muestra Estadística o dentro de una Población estudiada. En cambio, la Frecuencia Relativa es el cociente entre la Frecuencia Absoluta de un determinado resultado aparecido y la totalidad de resultados que conforman la Muestra Estadística estudiada. En otras palabras, la Frecuencia Relativa sirve para determinar cuál es el porcentaje de repetición de un determinado resultado frente a la totalidad de resultados que conforman la Muestra analizada. Tanto la Frecuencia Absoluta como la Frecuencia Relativa sirven para resumir y ordenar numéricamente (de menor a mayor) la totalidad de los diversos datos que conforman una Muestra Estadística estudiada, ordenación que se realiza precisamente teniendo en cuenta el valor de la Frecuencia de aparición que le corresponde a cada dato.
§  Frecuencia absoluta (ni) de una variable estadística Xi, es el número de veces que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).
§  Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,
Descripción: f_i = \frac{n_i}{N} = \frac{n_i}{\sum_i n_i}
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias (ver fig.1 y (fig.2).
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de N, es decir el 100% del conjunto.
§  Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N con un valor igual o menor al de la variable. La última frecuencia absoluta acumulada deberá ser igual a N.
§  Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el número total de datos, N. Es decir,
Descripción: F_i = \frac{N_i}{N}
Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación.

Rango

Algo que responde a la identificación de la dispersión de los datos de una muestra es el rango, el cual se define como la diferencia  entre el dato mayor menos el dato menor de un conjunto de datos. Su obtención es sumamente sencilla, sin embargo se considera que no es una medida muy significativa, su aplicación es más útil en la llamada estadística no parámetrica. Una expresión para el rango puede ser vista como:
La EstadÌstica es una ciencia que proporciona un conjunto de mÈtodos que
se utilizan para recolectar, resumir, clasificar, analizar e interpretar el
comportamiento de los ìdatosî con respecto a una caracterÌstica materia de
estudio o investigaciÛn.
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables
TIPOS DE MEDIDAS ESTADÍSTICAS



   Indican los valores más representativos de un conjunto de datos.
1.     Media aritmética
2.     Mediana
3.     Moda
Se utilizan para medir el grado de dispersión que existe en la distribución.
3.     Desviación media
4.     Varianza
Nos informa del lugar que ocupa un dato dentro de un conjunto ordenado de valores.
1.     Quartiles
2.     Percentiles


  • Se denota por X
  • Se divide la suma de los datos por el número total de ellos.
  • O si los datos vienen en una tabla con sus frecuencias absolutas (fi ( tantos con este valor, otros tantos con otro valor...), se multiplica cada dato   xi  por su frecuencia fi
         x =   ( x1.f1 + x2.f2 + ....+ xn.fn) / N  = ∑ (xi.fi)/N
  • Se representa por Me
  •  Es el valor central de un conjunto de datos
  • Se ordenan los valores en orden creciente y se toma el que ocupa el lugar central (si el número de valores es impar o la media de los dos centrales si es par).
  • Si se trata de la mediana de valores agrupados
  • Se representa por Mo
  • Es el valor que más se repite.
  • Si se repiten la serie es bimodal (2) o multimodal.
Me = l +( (n/2 -F)/f) * i
Ejemplo: Se desea conocer el precio mediano de los libros, el primer intervalo nos indica que se han comprado 3 libros entre 1-500, pts, 13 entre 501 y 1000, y así sucesivamente ...
Precio
Frecuencia (f)
Frec. acumulada (F)
Amplitud intervalo
1-500
3
3
500
501-1000
13
16
''
1001-1500
25
41
''
1501-2000
20
61
''
2001-2500
18
79
''
2501-3000
20
99
''
3001-3500
11
110
''
l - > límite inferior del intervalo que contiene la mediana:
  • Se divide por dos el número total de observaciones: 110/2 = 55
  •  La mediana se encontrará en el intervalo que tenga la frecuencia acumulada más cerca de 55, en este caso 61
  • El límite inferior que corresponde a esa frecuencia es 1501, por tanto  l = 1501
   
n ->  es la frecuencia total
  • En este caso el número total de libros comprados es n= 110
F-> frecuencia acumulativa que corresponde al límite inferior que contiene la mediana.  F= 41
f-> Número de casos del intervalo que contiene la mediana. f= 20
i-> amplitud del intervalo que contiene la mediana. i = 500
Sustituyendo los valores en la fórmula
Me = l +( (n/2 -F)/f) * i  = 1501 + ( (110/2 - 41) / 20 ) * 500
  • Se representa por R
  • Es la diferencia entre el mayor y el menor de los valores.
  • Si aparecen valores extremos deja de ser representativo.
  • Se utiliza cuando aparecen valores extremos en la distribución y también se desea tener en cuenta las frecuencias.
  • Se dividen las frecuencias en cuatro partes iguales separando los valores en quartiles.
  • Se halla la diferencia entre el valor del cuartil tercero (Q3) y el primero (Q1)
  • Se consideran por tanto el recorrido del 50% de los elementos sin tener en cuenta el primer y último tramo (25 % y 25%), descartando por tanto los valores extremos.
  • Ejemplo
  • La desviación de un dato x respecto a la media x es la diferencia entre ambos
  • La desviación media DM  es la media aritmética de los valores absolutos (siempre positivos) de las desviaciones de cada dato respecto a la media.  DM =( f1. |x1-x| + ...+ fn. |xn-x|) / N
Varianza2)
  • Es la media aritmética de los cuadrados de las desviaciones respecto de la media.
                            σ2 =( f1. (x1-x)2 + ...+ fn. (xn-x)2) / N
  • Es la raíz cuadrada positiva de la desviación típica
                    σ=√( ( f1. (x1-x)2 + ...+ fn. (xn-x)2) / N )
  • Es el cociente entre la desviación típica y la media  CV =  σ / x
Este ejemplo se basa en el número de libros leídos por los estudiantes, donde:
  • x -> número de libros leídos.
  • fi -> número de estudiantes que han leído x libros (frecuencia)
  • Fi-> número total de estudiantes (frecuencia acumulada)
xi
fi
Fi
fi * xi
|xi-x|
fi*|xi-x|
fi*(xi-x)2
0
2
2
0
3,22
6,44
20,74
1
3
5
3
2,22
6,66
14,79
2
5
10
10
1,22
6,10
7,44
3
8
18
24
0,22
1,76
0,39
4
8
26
32
0,78
6,24
4,87
5
3
29
15
1,78
5,34
9,51
6
2
31
12
2,78
5,56
15,46
7
1
32
7
3,78
3,78
14,29
SUMA
32

103

41,88
87,49
Media aritmética
         x =   ( x1.f1 + x2.f2 + ....+ xn.fn) / N  = ∑ (xi.fi)/N = 103 / 32 = 3,22 libros leídos.
Moda:
Existen dos modas (el valor que más se repite), Mo = 3 y Mo=4,  ya que en ambos casos hay ocho alumnos (el máximo).
Mediana:
Al ser un número de valores par ( 8 datos en total), se toman los dos centrales y se halla la media Me = (3 + 4)/2= 3,5
Recorrido : R = 7 - 0 = 7
Desviación media:
 DM =( f1. |x1-x| + ...+ fn. |xn-x|) / N = 41,88 / 32 = 1,31 libros
Varianza:
             σ2 =( f1. (x1-x)2 + ...+ fn. (xn-x)2) / N = 87,49 /32 = 2,73 libros2.