Medidas de tendencias central - Mediana

Mediana

  • Es un valor dentro de un grupo finito de datos que determina la observación que ocupa la posición central en los datos.

  • Esta única observación es la más cercana a la mitad o la más central en el grupo de datos y divide el grupo de observaciones en dos partes iguales.

Mediana

  • Esta medida depende de la posición de los datos en relación a los demás, y no a la magnitud del valor de ellos.

  • Para poder determinar qué valor tiene la mediana, es necesario ordenar los datos (menor a mayor, o viceversa), y determinar si el total de observaciones \((n)\) es par o impar.

Mediana con vector numérico par

  • Si el es un número total de observaciones es par la mediana se determina utilizando el siguiente procedimiento:

  • Ej. velocidad de los autos en el 1920

    1. Obtener el vector numérico
cars$speed
 [1]  4  4  7  7  8  9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15
[26] 15 16 16 17 17 17 18 18 18 18 19 19 19 20 20 20 20 20 22 23 24 24 24 24 25

Mediana con vector numérico par

    1. Ordenar los valores
s_sort <- sort(cars$speed)
s_sort
 [1]  4  4  7  7  8  9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15
[26] 15 16 16 17 17 17 18 18 18 18 19 19 19 20 20 20 20 20 22 23 24 24 24 24 25

Mediana con vector numérico par

    1. Contar el número de observaciones
Num_Vec <- length(s_sort)
Num_Vec
[1] 50

En este caso es par

Mediana con vector numérico par

    1. Determinar la posición central del vector numérico mediante:

\[(n+1)/2\]

Posi <- (Num_Vec + 1) / 2
Posi
[1] 25.5

Mediana con vector numérico par

    1. Escoger los dos valores a promediar
vP <- s_sort[c(25, 26)]
vP
[1] 15 15

Mediana con vector numérico par

    1. Promediar
sum(vP) / 2
[1] 15

Mediana con vector numérico par

ó

median(cars$speed)
[1] 15

Mediana con vector numérico impar

  • Si el un número total de observaciones es impar la mediana es el valor de la observación que ocupa la posición central.

    1. Obtener el vector numérico
CMod <- c(cars$speed, 16)
CMod 
 [1]  4  4  7  7  8  9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15
[26] 15 16 16 17 17 17 18 18 18 18 19 19 19 20 20 20 20 20 22 23 24 24 24 24 25
[51] 16
length(CMod)
[1] 51

Mediana con vector numérico impar

    1. Ordenar los valores y escoger el del centro
s_sort <- sort(CMod)
s_sort
 [1]  4  4  7  7  8  9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15
[26] 15 16 16 16 17 17 17 18 18 18 18 19 19 19 20 20 20 20 20 22 23 24 24 24 24
[51] 25
CMod[round((length(CMod) / 2) + 1)]
[1] 15

Mediana con vector numérico impar

o

median(CMod)
[1] 15

Propiedades de la mediana

  1. Para calcular la mediana es necesario arreglar la serie numérica en orden (ascendente o descendente) de magnitud.

  2. La mediana depende esencialmente del número de observaciones (n) y no de la magnitud de los valores involucrados.

  3. Apropiada para resumir series de datos que contienen observaciones extremas.

Propiedades de la mediana

Propiedades de la mediana

# Datos originales
datos_originales <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

# Datos con valor atípico
datos_atipico <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 100)

# Datos escalados
datos_escalados <- datos_originales * 10

summary(datos_originales)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1.00    3.25    5.50    5.50    7.75   10.00 
summary(datos_atipico)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1.00    3.25    5.50   14.50    7.75  100.00 
summary(datos_escalados)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   10.0    32.5    55.0    55.0    77.5   100.0 

Propiedades de la mediana

🎉 ¡Felicidades!

Has completado este módulo.

Recuerda: soy tu acompañante en este viaje de aprendizaje.
Puedes volver aquí siempre que lo necesites.

Ahora puedes hacer la práctica del módulo en una nueva pestaña.

Cuando estés listo, regresa al directorio para continuar explorando otros temas.