MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DISPERSIÓN.
1. Resumen numérico de una serie estadística:
Además de las tablas y gráficos podemos resumir una serie de observaciones mediante estadísticos. Solo se aplican a variables cuantitativas continuas.
Tres tipos de medidas estadísticas:
- Medidas de posición: informa de la magnitud, tamaño o posición de las observaciones de los datos una vez que están ordenados de menor a mayor.
- Medidas de tendencia central: dan idea del comportamiento central de los sujetos.
- Medidas de dispersión o variabilidad: información sobre la heterogeneidad de los sujetos, diferencia entre ellos.
2. Medidas de tendencia central
- Media aritmética (x): suma de todos los valores de la variable observada entre el total de observaciones.
- Media aritmética ponderada (cuando los datos estan agrupados en intervalos): se suma la marca de clase multiplicada por la frecuencia absoluta y dividimos netre el número de sujetos.
- Mediana: valor de la observación que se queda en el 50% de los datos hacia arriba y hacia abajo; si el número de observaciones es impar, se suman los dos valores que quedan en el centro y se dividen entre 2.
- Propiedad: solo se tiene en cuenta la posición de los valores en la muestra, por lo que tiene mucho mejor comportamiento que la media cuando hay observaciones.
- Moda: valor que más se repite. Si hay más de una la muestra es bimodal y más de dos multimodal.
- Clase modal: cuando los datos están agrupados y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud (se resta el intervalo mayor menos el menor).
3. Medidas de posición o cuantiles: para variables cuantitativas y, solo se tiene en cuenta la posición ordenado de mayor a menor de los valores en la muestra.
- Percentiles: divide la muestra ordenada en 100 apartes, para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil; el P50 es el valor de la mediana.
- Deciles: divide la muestra ordenada en 10 partes; el D5 es igual a la mediana y, por tanto, al del P50.
- Cuartil: divide la muestra ordenada en 4 partes, Q2 es igual a la mediana.
4. Medidas de dispersión
La información aportada por las medidas de tendencia central es limitada.
- Rango o recorrido: diferencia entre el mayor y el menor valor de la muestra.
- Desviación media: media aritmética de las distancias de cada observación con respecto a la media de la muestra.
- Desviación típica o estándar: cuantifica el error que cometemos si representamos una muestra únicamente por su media.
- Varianza: la misma información peor en valores cuadráticos.
- Recorrido intercuartílico: diferencia entre el tercer y primer cuartil.
- Coeficiente de variación: medida de dispersión relativa. Para comparar la hetrogenidad de dos series numéricas con independencia de las unidades de medidas. Va de 0 a 1.
5. Distribuciones normales
Distribución de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
Las distribuciones normales en un histograma aparece una especie de campana, por eso la campana de Gauss. Es simétrica respecto de los valores de posición central, la moda va coincidir con la media y la mediana.
6. Asimetría y Curtosis
- Coeficiente de asimetría de una variable: grado de asimetría de la distribución de sus datos en torno a su media.
- Curtosis o apuntamiento de la curva: no tiene relación con la simetría, sirve para medir el grado de concentración de los valores que toma en torno a su media. Los datos se acumulan mucho, mientras más se acumulen, más apuntada es la curva.
No hay comentarios:
Publicar un comentario