Lección 3

Una galería de datos

  • Hagamos, comparemos e interpretemos representaciones visuales de datos.

3.1: Observa y pregúntate: Diagramas de puntos

Los diagramas de puntos representan la distribución de las propinas, en dólares, que se dejaron en 2 restaurantes distintos durante la misma noche.

¿Qué observas? ¿Qué te preguntas?

Dot plot from 0 to 11 by 1’s. tip amount (dollars). Beginning at 0, number of dots above each increment is 0, 1, 2, 3, 4, 2, 1, 1, 2, 1, 1, 0.
Dot plot from 7 to 18 by 1’s. tip amount (dollars). Beginning at 7, number of dots above each increment is 0, 1, 2, 3, 4, 2, 1, 1, 2, 1, 1, 0.

3.2: Representaciones visuales de datos

Tu profesor le asignará a tu grupo una pregunta estadística. En grupo:

  1. Hagan un diagrama de puntos, un histograma y un diagrama de caja que muestren la distribución de los datos.
  2. Escriban 3 interpretaciones de los datos.

Cuando vayas a ver cada representación visual, escribe una o dos frases que resuman la información que ves.



Escoge una de las preguntas más interesantes que tú o uno de tus compañeros usaron y recolecta datos de un grupo más grande, por ejemplo, de más estudiantes de la escuela. Haz una representación visual de los datos y compara los resultados con los resultados de los datos recolectados en clase.

Resumen

Hay varias maneras de representar la distribución de unos datos, por ejemplo, con listas, diagramas de puntos, histogramas y diagramas de caja. Una lista muestra todos los valores que hay en un conjunto de datos y se puede organizar de diferentes maneras. Esta lista muestra el pH de 30 muestras de agua distintas. 

  • 5.9
  • 7.6
  • 7.5
  • 8.2
  • 7.6
  • 8.6
  • 8.1
  • 7.9
  • 6.1
  • 6.3
  • 6.9
  • 7.1
  • 8.4
  • 6.5
  • 7.2
  • 6.8
  • 7.3
  • 8.1
  • 5.8
  • 7.5
  • 7.1
  • 8.4
  • 8.0
  • 7.2
  • 7.4
  • 6.5
  • 6.8
  • 7.0
  • 7.4
  • 7.6

Esta es la misma lista, ordenada de menor a mayor. 

  • 5.8
  • 5.9
  • 6.1
  • 6.3
  • 6.5
  • 6.5
  • 6.8
  • 6.8
  • 6.9
  • 7.0
  • 7.1
  • 7.1
  • 7.2
  • 7.2
  • 7.3
  • 7.4
  • 7.4
  • 7.5
  • 7.5
  • 7.6
  • 7.6
  • 7.6
  • 7.9
  • 8.0
  • 8.1
  • 8.1
  • 8.2
  • 8.4
  • 8.4
  • 8.6


Con la lista ordenada es más fácil:

  • interpretar los datos
  • calcular los valores del resumen de cinco números
  • estimar o calcular la media
  • crear un diagrama de puntos, un diagrama de caja o un histograma

Estos son un diagrama de puntos y un histograma que representan la distribución de los datos de la lista.

Dot plot from 5.5 to 9 by 0.5’s. pH. Beginning at 5.5 up to but not including 6, number of dots in each interval is 2, 2, 5, 8, 6, 6, 1, 0.
Histogram from 5.5 to 9 by 0.5’s. pH. Beginning at 5.5 up to but not including 6, height of bar at each interval is 2, 2, 5, 8, 6, 6, 1.

Para crear un diagrama de puntos, se pone un punto por cada valor. Cada punto se pone encima de su ubicación en una recta numérica. En el diagrama de puntos del pH, hay 2 muestras de agua que tienen un pH de 6.5 y 1 muestra de agua que tiene un pH de 7. Para crear un histograma, se cuenta el número de valores del conjunto de datos que están en un cierto intervalo y encima de ese intervalo se dibuja una barra que tenga una altura igual al número que se contó. En el histograma del pH, hay 5 muestras de agua que tienen un pH que está entre 6.5 y 7 (incluido 6.5, pero no 7). Este es un diagrama de caja que representa la distribución de los mismos datos representados por el diagrama de puntos y el histograma.

Box plot from 5 point 5 to 9 by point 5’s. pH. Whisker from 5 point 8 to 6 point 8. Box from 6 point 8 to 7 point 9 with vertical line at 7 point 35. Whisker from 7 point 9 to 8 point 6.

Para crear un diagrama de caja, debes encontrar el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo del conjunto de datos. Estos 5 valores juntos a veces son llamados el resumen de cinco números. Al dibujar una marca vertical y unir las partes como en el ejemplo, se crea el diagrama de caja. En el diagrama de caja del pH, podemos ver que el mínimo es aproximadamente 5.8, la mediana es aproximadamente 7.4 y el tercer cuartil es aproximadamente 7.9.

Entradas del glosario

  • datos categóricos
    Unos datos son categóricos cuando sus valores son categorías. Por ejemplo, las razas de 10 perros distintos son datos categóricos. Otro ejemplo: los colores de 100 flores distintas.
  • datos numéricos
    Unos datos son numéricos cuando sus valores son números, medidas o cantidades. También se les llama datos cuantitativos o de mediciones. Por ejemplo, los pesos de 10 perros distintos son datos numéricos.
  • distribución

    Dado un conjunto de datos numéricos o categóricos, su distribución nos dice cuántos hay de cada valor o de cada categoría en el conjunto.

  • pregunta estadística

    Una pregunta estadística es una pregunta que solo se puede responder usando datos y en la que se espera que los datos tengan variabilidad. Por ejemplo:

    • ¿Quién es el artista musical más popular en tu escuela?
    • ¿A qué horas cenan típicamente los estudiantes de tu clase?
    • ¿Qué salón de clase de tu escuela tiene la mayor cantidad de libros?
  • pregunta no estadística

    Una pregunta no estadística es una pregunta que se puede responder con una medición o procedimiento específico y para la cual no se espera ver variabilidad en la respuesta. Por ejemplo:

    • ¿Qué tan alto es ese edificio?
    • Si corro a 2 metros por segundo, ¿cuánto tiempo tardaré en correr 100 metros?
  • resumen de cinco números

    El resumen de cinco números de un conjunto de datos está compuesto por el mínimo, los tres cuartiles y el máximo. A menudo, este resumen se muestra usando un diagrama de caja como el que está abajo. En este caso, el mínimo es 2, los tres cuartiles son 4, 4.5 y 6.5, y el máximo es 9.