Moda

Moda

Introducción a la Moda

  • La moda es una medida de tendencia central que indica el valor más frecuente en un conjunto de datos.

  • A diferencia de la media o la mediana, la moda puede utilizarse tanto en variables cualitativas como en cuantitativas.

  • Una muestra pudiera tener más de una moda.

cars$speed
 [1]  4  4  7  7  8  9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15
[26] 15 16 16 17 17 17 18 18 18 18 19 19 19 20 20 20 20 20 22 23 24 24 24 24 25

Moda

  • Contar las frecuencia de cada uno de los números.
getmode <- function(v) {
   uniqv <- unique(v)
   uniqv[which.max(tabulate(match(v, uniqv)))]
}

Moda

getmode(cars$speed)
[1] 20
hist(cars$speed)

Moda

getmode(diamonds$price)
[1] 605
hist(diamonds$price)

Moda

[1] G
Levels: D < E < F < G < H < I < J

Moda

[1] SI1
Levels: I1 < SI2 < SI1 < VS2 < VS1 < VVS2 < VVS1 < IF

Ejemplo Práctico en Epidemiología

  • En epidemiología, la moda es útil para identificar la categoría o valor que ocurre con mayor frecuencia, lo que puede ser relevante al analizar distribuciones de enfermedades, síntomas o factores de riesgo en una población.

Ejemplo Práctico en Epidemiología

  • Supongamos que estamos analizando los tipos más comunes de enfermedades respiratorias en una población.

Conjunto de datos

# Datos de ejemplo: enfermedades respiratorias más comunes
enfermedades <- c(
  "Asma", "Asma", "Bronquitis", "Neumonía", "Bronquitis", 
  "Asma", "Asma", "Neumonía", "Neumonía", "Asma"
)

# Convertir en un data frame
df_enfermedades <- data.frame(enfermedades)
df_enfermedades
   enfermedades
1          Asma
2          Asma
3    Bronquitis
4      Neumonía
5    Bronquitis
6          Asma
7          Asma
8      Neumonía
9      Neumonía
10         Asma

Distribución

library(tidyverse)
# Gráfico de barras
ggplot(df_enfermedades, aes(x = enfermedades)) +
  geom_bar(fill = "lightblue") +
  labs(title = "Frecuencia de Enfermedades Respiratorias",
       x = "Enfermedad",
       y = "Frecuencia") +
  theme_minimal()

Selección de la moda

# Calcular la moda
moda <- df_enfermedades %>%
  count(enfermedades) %>%
  arrange(desc(n)) %>%
  slice(1)

moda
  enfermedades n
1         Asma 5

Moda

  • Algunas distribuciones tienen más de un moda.

  • Un método útil para clasificar distribuciones es por el número de modas presentes en los datos.

  • Una distribución con una moda se llama unimodal; dos modas, bimodal; tres modas, trimodal, etcétera.

  • La moda es más útil como medida de tendencia central cuando se examinan datos categóricos, como modelos de automóviles o sabores de refrescos, para lo que no se puede calcular un valor medio matemático.

Ventajas de la Moda

  • La moda es fácil de entender y calcular.
  • La moda no se ve afectada por valores extremos.
  • La moda es fácil de identificar en un conjunto de datos y en una distribución de frecuencia discreta.
  • La moda es útil para datos cualitativos.
  • La moda se puede calcular en una tabla de frecuencias.
  • La moda se puede ubicar gráficamente.

Desventajas de la moda:

  • La moda no se define cuando no hay repeticiones en un conjunto de datos.
  • La moda no se basa en todos los valores.
  • La moda es inestable cuando los datos constan de una pequeña cantidad de valores.
  • A veces, los datos tienen más de una moda o ninguna moda.

Moda

getmode(diamonds$price)
[1] 605
getmode(diamonds$color)
[1] G
Levels: D < E < F < G < H < I < J
getmode(diamonds$clarity)
[1] SI1
Levels: I1 < SI2 < SI1 < VS2 < VS1 < VVS2 < VVS1 < IF

🎉 ¡Felicidades!

Has completado este módulo.

Recuerda: soy tu acompañante en este viaje de aprendizaje.
Puedes volver aquí siempre que lo necesites.

Ahora puedes hacer la práctica del módulo en una nueva pestaña.

Cuando estés listo, regresa al directorio para continuar explorando otros temas.