Frecuencia es una medida para
indicar el número de repeticiones de cualquier fenómeno o suceso periódico en
la unidad de tiempo. Para calcular la frecuencia de un evento, se contabilizan
un número de ocurrencias de este teniendo en cuenta un intervalo temporal,
luego estas repeticiones se dividen por el tiempo transcurrido.
La Frecuencia Absoluta expresa el número de veces que en total
aparece un determinado resultado dentro de una Muestra Estadística o dentro de
una Población estudiada. En cambio, la Frecuencia Relativa es el
cociente entre la Frecuencia Absoluta de un determinado resultado aparecido y
la totalidad de resultados que conforman la Muestra Estadística estudiada. En
otras palabras, la Frecuencia Relativa sirve para determinar cuál es el porcentaje
de repetición de un determinado resultado frente a la totalidad de resultados
que conforman la Muestra analizada. Tanto
la Frecuencia Absoluta como la Frecuencia Relativa sirven para resumir y
ordenar numéricamente (de menor a mayor) la totalidad de los diversos datos
que conforman una Muestra Estadística estudiada, ordenación que se realiza
precisamente teniendo en cuenta el valor de la Frecuencia de aparición que le
corresponde a cada dato.
§ Frecuencia absoluta (ni)
de una variable estadística Xi, es el número de veces
que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el
tamaño de la frecuencia absoluta; es decir, la suma total de todas las
frecuencias absolutas debe dar el total de la muestra estudiada (N).
§ Frecuencia relativa (fi),
es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N).
Es decir,
siendo el fi para
todo el conjunto i. Se presenta en una tabla o nube de puntos en
una distribución
de frecuencias (ver fig.1 y (fig.2).
Si multiplicamos la
frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi)
que presentan esta característica respecto al total de N, es decir
el 100% del conjunto.
§ Frecuencia absoluta
acumulada (Ni), es el número de veces ni en
la muestra N con un valor igual o menor al de la variable. La
última frecuencia absoluta acumulada deberá ser igual a N.
§ Frecuencia relativa
acumulada (Fi), es el cociente entre la frecuencia
absoluta acumulada y el número total de datos, N. Es decir,
Una gráfica es una representación de datos, generalmente
numéricos, mediante líneas, superficies o símbolos, para ver la relación.
Rango
Algo que responde a la identificación de la dispersión de los datos de
una muestra es el rango, el cual se define como la diferencia entre el
dato mayor menos el dato menor de un conjunto de datos. Su obtención es
sumamente sencilla, sin embargo se considera que no es una medida muy
significativa, su aplicación es más útil en la llamada estadística no
parámetrica. Una expresión para el rango puede ser vista como:
La EstadÌstica es una ciencia que proporciona un conjunto de
mÈtodos que
se utilizan para recolectar, resumir, clasificar, analizar e
interpretar el
comportamiento de los ìdatosî con respecto a una
caracterÌstica materia de
estudio o investigaciÛn.
La probabilidad mide la frecuencia con la que se obtiene un
resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio,
del que se conocen todos los resultados posibles, bajo condiciones
suficientemente estables
TIPOS DE
MEDIDAS ESTADÍSTICAS
Indican los valores más representativos de un conjunto de
datos.
Se utilizan para medir el grado de dispersión que existe en la
distribución.
Nos informa del lugar que ocupa un dato dentro de un conjunto ordenado
de valores.
- Se denota por X
- Se divide la suma de los
datos por el número total de ellos.
- O si los datos vienen en una
tabla con sus frecuencias absolutas (fi ( tantos con este
valor, otros tantos con otro valor...), se multiplica cada
dato xi por su frecuencia fi
x =
( x1.f1 + x2.f2 + ....+ xn.fn)
/ N = ∑ (xi.fi)/N
- Se representa por Me
- Es el valor central de
un conjunto de datos
- Se ordenan los valores en
orden creciente y se toma el que ocupa el lugar central (si el número de
valores es impar o la media de los dos centrales si es par).
- Si se trata de la mediana de
valores agrupados
- Se representa por Mo
- Es el valor que más se
repite.
- Si se repiten la serie es
bimodal (2) o multimodal.
Me = l +( (n/2 -F)/f) * i
Ejemplo: Se desea conocer el precio mediano de los libros, el primer
intervalo nos indica que se han comprado 3 libros entre 1-500, pts, 13 entre
501 y 1000, y así sucesivamente ...
Precio
|
Frecuencia
(f)
|
Frec.
acumulada (F)
|
Amplitud
intervalo
|
1-500
|
3
|
3
|
500
|
501-1000
|
13
|
16
|
''
|
1001-1500
|
25
|
41
|
''
|
1501-2000
|
20
|
61
|
''
|
2001-2500
|
18
|
79
|
''
|
2501-3000
|
20
|
99
|
''
|
3001-3500
|
11
|
110
|
''
|
l - > límite inferior del intervalo que contiene la mediana:
- Se divide por dos el número
total de observaciones: 110/2 = 55
- La mediana se
encontrará en el intervalo que tenga la frecuencia acumulada más cerca de
55, en este caso 61
- El límite inferior que
corresponde a esa frecuencia es 1501, por tanto l = 1501
n -> es la frecuencia total
- En este caso el número total
de libros comprados es n= 110
F-> frecuencia acumulativa que corresponde al límite inferior que contiene
la mediana. F= 41
f-> Número de casos del intervalo que contiene la mediana. f= 20
i-> amplitud del intervalo que contiene la mediana. i = 500
Sustituyendo los valores en la fórmula
Me = l +( (n/2 -F)/f) * i = 1501 + ( (110/2 - 41)
/ 20 ) * 500
- Se representa por R
- Es la diferencia entre el
mayor y el menor de los valores.
- Si aparecen valores extremos
deja de ser representativo.
- Se utiliza cuando aparecen
valores extremos en la distribución y también se desea tener en cuenta las
frecuencias.
- Se dividen las frecuencias
en cuatro partes iguales separando los valores en quartiles.
- Se halla la diferencia entre
el valor del cuartil tercero (Q3) y el primero (Q1)
- Se consideran por tanto el
recorrido del 50% de los elementos sin tener en cuenta el primer y último
tramo (25 % y 25%), descartando por tanto los valores extremos.
- Ejemplo
- La desviación de un
dato x respecto a la media x es la
diferencia entre ambos
- La desviación media DM
es la media aritmética de los valores absolutos (siempre positivos) de las
desviaciones de cada dato respecto a la media. DM =( f1.
|x1-x| + ...+ fn. |xn-x|) / N
- Es la media aritmética de
los cuadrados de las desviaciones respecto de la media.
σ2 =( f1. (x1-x)2 + ...+ fn.
(xn-x)2) / N
- Es la raíz cuadrada positiva
de la desviación típica
σ=√( ( f1. (x1-x)2 + ...+ fn.
(xn-x)2) / N )
- Es el cociente entre la
desviación típica y la media CV = σ / x
Este ejemplo se basa en el número de libros leídos por los estudiantes,
donde:
- x -> número de libros
leídos.
- fi -> número de
estudiantes que han leído x libros (frecuencia)
- Fi-> número total de
estudiantes (frecuencia acumulada)
xi
|
fi
|
Fi
|
fi * xi
|
|xi-x|
|
fi*|xi-x|
|
fi*(xi-x)2
|
0
|
2
|
2
|
0
|
3,22
|
6,44
|
20,74
|
1
|
3
|
5
|
3
|
2,22
|
6,66
|
14,79
|
2
|
5
|
10
|
10
|
1,22
|
6,10
|
7,44
|
3
|
8
|
18
|
24
|
0,22
|
1,76
|
0,39
|
4
|
8
|
26
|
32
|
0,78
|
6,24
|
4,87
|
5
|
3
|
29
|
15
|
1,78
|
5,34
|
9,51
|
6
|
2
|
31
|
12
|
2,78
|
5,56
|
15,46
|
7
|
1
|
32
|
7
|
3,78
|
3,78
|
14,29
|
SUMA
|
32
|
103
|
41,88
|
87,49
|
Media aritmética
x =
( x1.f1 + x2.f2 + ....+ xn.fn)
/ N = ∑ (xi.fi)/N = 103 / 32 = 3,22 libros
leídos.
Moda:
Existen dos modas (el valor que más se repite), Mo = 3 y
Mo=4, ya que en ambos casos hay ocho alumnos (el máximo).
Mediana:
Al ser un número de valores par ( 8 datos en total), se toman los dos
centrales y se halla la media Me = (3 + 4)/2= 3,5
Recorrido : R = 7 - 0 = 7
Desviación media:
DM =( f1. |x1-x| + ...+ fn. |xn-x|)
/ N = 41,88 / 32 = 1,31 libros
Varianza:
σ2 =( f1. (x1-x)2 + ...+ fn.
(xn-x)2) / N = 87,49 /32 = 2,73 libros2.
No hay comentarios:
Publicar un comentario