Parámetros de dispersión. Son datos que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización.
Por ejemplo, vamos a suponer que hemos realizado el mismo examen en dos grupos distintos. En uno, todos los alumnos han sacado la misma nota, un 5; en otro, la mitad de los alumnos ha sacado un 0 y la otra mitad un 10. ¿Cuál es la media en los dos casos? ¿Se pueden considerar los dos grupos iguales si la media coincide?
Parece entonces que no es suficiente con las medidas de centralización, hace falta otros parámetros que informen sobre la mayor o menor concentración de los datos.
Recorrido. Se define el recorrido como la diferencia entre el mayor y el menor de los valores de la variable. Se representa por R. Nos indica un intervalo en el que están comprendido todos los datos.
A veces puede ocurrir que hay valores de la variable, excesivamente pequeños o grandes que hacen que la información que proporciona el recorrido sea equivocada, por ejemplo si en la estatura tenemos todos los alumnos y alumnas con una estatura normal y uno o una mide alrededor de dos metros. Para estos casos es más útil el siguiente parámetro.
Recorrido intercuartílico. Es la diferencia entre los cuartiles tercero y primero. Se representa por RI (RI=C3-C1) y representa la amplitud del intervalo en el que se encuentra el 50% central de los datos.
Escena 14. Cálculo de la desviación media.
Varianza. Se define la varianza como la media aritmética de los cuadrados de las desviaciones respecto de la media.
Para calcularla, aplicamos la fórmula:
Si desarrollamos esta fórmula, podemos encontrar otra expresión más sencilla para el cálculo de la varianza:
Desviación típica. Se define la desviación típica como la raíz cuadrada positiva de la varianza.
Escena 15. Cálculo de la varianza y desviación típica.
|