parámetros de centralización
ESTADÍSTICA. DISTRIBUCIONES UNIDIMENSIONALES
Estadística
 

4.1. PARÁMETROS DE CENTRALIZACIÓN

Parámetros de centralización. Son datos que representan de forma global a toda la población. Por ejemplo, si hacemos un examen en la clase y queremos tener una idea global del resultado de dicho examen, ¿cómo lo podríamos hacer? Parece lógico que sumando todas las notas y dividiendo el resultado por el número de alumnos, es decir, lo que todos conocemos como calculando la media.

Media aritmética. Se define la media aritmética como la suma de todos los datos dividida por el número de datos. Se representa por aaa

Para calcular la media aritmética hacemos:

bbb

Sin embargo, podemos observar que aparecen datos repetidos y que en un estudio estadístico tenemos los datos agrupados en una tabla en la que aparecen las frecuencias. Por tanto, podemos simplificar el cálculo de la media aritmética con la fórmula:

ccc

Si la variable es continua, el cálculo se hace de la misma forma pero utilizando las marcas de clase.

Escena 7. Cálculo de la media aritmética.

Moda. Se define la moda como el valor de la variable que más se repite, es el decir, aquél que tiene mayor frecuencia absoluta. Se representa por Mo.

Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas.

Si la variable es discreta, el cálculo de la moda no presenta ninguna dificultad, únicamente observamos las frecuencias, vemos cuál es la mayor y la moda será el valor de la variable correspondiente a dicha frecuencia.

En la siguiente escena podemos calcular la moda de una variable discreta.

Escena 8. Cálculo de la moda para una variable discreta.

Sin embargo si la variable es continua la mayor frecuencia absoluta corresponde a un intervalo, del que decimos que es el intervalo modal. Pero si queremos calcular un único valor de la variable para la moda, aplicamos la siguiente fórmula:

ddd

en la que Li representa el límite inferior del intervalo modal, c es la amplitud del intervalo y fMo, fMo-1 y fMo+1 son las frecuencias del intervalo modal, el anterior y el posterior.

Escena 9. Cálculo de la moda para una variable continua.

Mediana. Si ordenamos todos los valores de la variable de menor a mayor, se define la mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí tenemos que comprender que si hay un número impar de valores, habrá un sólo valor central; mientras que si hay un número par de valores habrá dos valores centrales.

También vamos a distinguir para su cálculo entre variable discreta y variable continua.

Si la variable es discreta y el número de datos es impar, la mediana será el dato que ocupe el lugar central.

Si la variable es discreta y el número de datos es par, la mediana será la media aritmética de los dos valores centrales.

Escena 10. Cálculo de la mediana para una variable discreta.

Si la variable es continua, no distinguiremos si el número de datos es par o impar, tendremos un intervalo para la mediana. Igual que se ha hecho con la moda podemos suponer que los datos se distribuyen uniformemente en los intervalos y calcular la mediana con la siguiente fórmula:

eee

en la que N representa el número de datos y F se refiere a la frecuencia absoluta acumulada.

Escena 11. Cálculo de la mediana para una variable continua.

Cuartiles, deciles y percentiles. Entre las medidas de centralización y de dispersión podemos citar éstas que tienen el cálculo similar al de la mediana.

Cuartiles. Son valores que dividen a la población en cuatro partes iguales. Los vamos a representar por C1, C2 y C3. Entre cada dos de ellos estará el 25 % de los datos. Lógicamente el segundo cuartil coincidirá con la mediana.

Deciles. Son valores que dividen a la población en diez partes iguales. Los representaremos por Dn. El quinto decil coincide también con la mediana.

Percentiles. Son valores que dividen a la población en cien partes iguales. Los representamos por Pn. Evidentemente los percentiles 25, 50 y 75 coinciden con los cuartiles. Y los percentiles 10, 20 , ... , 90 coinciden con los deciles.

El cálculo de estos parámetros, tanto para variables discretas como para variables continuas, se hace de forma similar al cálculo de la mediana.

Si la variable es discreta, para calcular un percentil, calcularemos el porcentaje de datos que corresponde a dicho percentil, es decir para calcular el percentil de orden "p", calcularemos p·N/100. Si este valor no coincide con ninguna de las frecuencias absolutas acumuladas, cogemos el primer valor de la variable cuya frecuencia absoluta acumulada supera este dato. Pero si este valor coincide con una frecuencia absoluta acumulada, el percentil buscado será la media aritmética entre el valor de la variable correspondiente y el siguiente.

Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada para el cálculo de la mediana:

fff

Escena 12. Cálculo de percentiles para una variable discreta.

Escena 13. Cálculo de percentiles para una variable continua.

 

       
           
  Autor: Luis Barrios Calmaestra
Adaptación a DescartesJS: Enric Ripoll i Mira (2018)
 
ProyectoDescartes.org. Año 2017
 
 

Licencia de Creative Commons
Los contenidos de esta unidad didáctica están bajo una licencia de Creative Commons si no se indica lo contrario.