Introducción a las Estadísticas Descriptivas

Estadísticas descriptivas

  • El primer paso para analizar datos es describir de una manera concisa.
Normal95

Estadísticas descriptivas son herramientas

  • Herramientas
    • Organizar
    • Resumir
    • Visualizar

Primer paso: Describir de manera clara y concisa

Para describir los datos necesitamos conocer:

  1. El objetivo de captura de datos (La pregunta de investigación)

  2. La estructura de datos:

    • Dimensión del conjunto de datos
    • Tipo de variable
    • Significado de cada variable
    • Unidades de cada variable

Objetivo de la captura de datos

  • Definir claramente el objetivo de la recolección de datos asegura que respondemos a una pregunta de investigación específica y relevante.
Researcher_Brainstorming_Ideas

Estructura de los datos

ID

Nombre

Edad

Puntaje

1

Ana

23

88

2

Luis

45

92

3

Marta

34

75

4

Carlos

42

85

5

Lucía

25

90

Dimensiones: 5 Filas x 4 Columnas

'data.frame':   5 obs. of  4 variables:
 $ ID     : int  1 2 3 4 5
 $ Nombre : chr  "Ana" "Luis" "Marta" "Carlos" ...
 $ Edad   : num  23 45 34 42 25
 $ Puntaje: num  88 92 75 85 90

Dimensión del conjunto de datos

ID

Nombre

Edad

Puntaje

1

Ana

23

88

2

Luis

45

92

3

Marta

34

75

4

Carlos

42

85

5

Lucía

25

90

Dimensiones: 5 Filas x 4 Columnas

Tipo de variables

  • Numérica de valores íntegros
  • Numérica de valores continuos
  • Categóricas
  • Carácter
  • Booleanos

Tipo de variables

kable(str(df))
'data.frame':   5 obs. of  4 variables:
 $ ID     : int  1 2 3 4 5
 $ Nombre : chr  "Ana" "Luis" "Marta" "Carlos" ...
 $ Edad   : num  23 45 34 42 25
 $ Puntaje: num  88 92 75 85 90

Significado de cada variable

  • Edad (meses o años)
  • Peso (kilogramos o libras)
  • Condición médica (crónica o infecciosa)

Unidades de cada variable

Variable

Unida

Metrico

Imperial

Pesp

kg

70.0

154.3

Estatura

cm

175.0

68.9

Temperatura

°C

36.6

98.0

Conjunto de datos, Cars

  • ¿Qué podemos decir de esta matriz de datos?
  • ¿Es posible analizar estos datos con la información que inferimos de esta matriz?
   speed dist
1      4    2
2      4   10
3      7    4
4      7   22
5      8   16
6      9   10
7     10   18
8     10   26
9     10   34
10    11   17
11    11   28
12    12   14
13    12   20
14    12   24
15    12   28
16    13   26
17    13   34
18    13   34
19    13   46
20    14   26
21    14   36
22    14   60
23    14   80
24    15   20
25    15   26
26    15   54
27    16   32
28    16   40
29    17   32
30    17   40
31    17   50
32    18   42
33    18   56
34    18   76
35    18   84
36    19   36
37    19   46
38    19   68
39    20   32
40    20   48
41    20   52
42    20   56
43    20   64
44    22   66
45    23   54
46    24   70
47    24   92
48    24   93
49    24  120
50    25   85

Diccionario de datos

  • Titulo: Velocidad y distancia de frenado de los automóviles

  • Descripción

    • Los datos brindan la velocidad de los vehiculos y la distancia recorrida para detenerse.
    • Tenga en cuenta que los datos fueron registrados en la década de en 1920.
  • Formato

    • Un marco de datos con 50 observaciones sobre 2 variables.
    • [,1] speed: numérica; Velocidad (mph)
    • [,2] dist: numérica; Distancia para deternerse por completo (pies)
  • Fuente: Ezekiel, M. (1930) Methods of Correlation Analysis. Wiley.

  • Referencia: McNeil, D. R. (1977) Interactive Data Analysis. Wiley.

Título

  • Velocidad y distancia de frenado de los automóviles

Descripción

-   Los datos brindan la velocidad de los vehiculos y la distancia recorrida para detenerse.
-   Tenga en cuenta que los datos fueron registrados en la década de en 1920.

Formato

- Un marco de datos con 50 observaciones sobre 2 variables.
-  \[,1\] speed: numérica; Velocidad (mph)
-  \[,2\] dist: numérica; Distancia para deternerse por completo (pies)

Formato

class(cars)
[1] "data.frame"
dim(cars)
[1] 50  2

Formato

- Un marco de datos con 50 observaciones sobre 2 variables.
-  \[,1\] speed: numérica; Velocidad (mph)
-  \[,2\] dist: numérica; Distancia para deternerse por completo (pies)

Fuente y referencia

  • Fuente: Ezekiel, M. (1930) Methods of Correlation Analysis. Wiley.

  • Referencia: McNeil, D. R. (1977) Interactive Data Analysis. Wiley.

Diccionario de datos

Diccionario de datos

🎉 ¡Felicidades!

Has completado este módulo.

Recuerda: soy tu acompañante en este viaje de aprendizaje.
Puedes volver aquí siempre que lo necesites.

Ahora puedes hacer la práctica del módulo en una nueva pestaña.

Cuando estés listo, regresa al directorio para continuar explorando otros temas.