Lección 8

Describir distribuciones con histogramas

Describamos distribuciones a partir de histogramas.

8.1: ¿Cuál es diferente?: histogramas

¿Cuál histograma es diferente? Prepárate para explicar tu razonamiento.

Four histograms. 

8.2: Clasifiquemos histogramas

  1. Tu profesor le entregará a tu grupo un juego de tarjetas con histogramas. Clasifíquenlas en dos montones, una con los histogramas que son aproximadamente simétricos y la otra con los histogramas que no lo son.
  2. Discutan sus decisiones de clasificación con otro grupo. ¿Ambos están de acuerdo sobre qué tarjetas van en cada montón? De lo contrario, discutan las razones detrás de las diferencias y miren si pueden llegar a un acuerdo. Anoten sus decisiones definitivas.

    • Los histogramas que son aproximadamente simétricos:

    • Los histogramas que no son aproximadamente simétricos:

  3. Los histogramas también se describen por la cantidad de picos importantes que tienen. El histograma A es un ejemplo de una distribución con un pico que no es simétrico.

    ¿Qué otros histogramas tienen esta característica?

  4. Algunos histogramas tienen un hueco, un espacio entre dos barras donde no hay puntos de datos. Por ejemplo, si algunos estudiantes en una clase tienen 7 o más hermanos, pero el resto de los estudiantes tienen 0, 1 o 2 hermanos, el histograma de este conjunto de datos mostraría huecos entre las barras porque ningún estudiante tiene 3, 4, 5 o 6 hermanos.

    ¿Qué histogramas crees que presentan uno o más huecos?

  5. A veces hay algunos puntos de datos que están lejos del centro en un conjunto de datos. El histograma A es un ejemplo de una distribución con esta característica.

    ¿Cuáles otros histogramas presenten esta característica?

8.3: De camino a la escuela

Tu profesor te va a dar los datos que recogieron en clase el otro día.

  1. Usa los datos para dibujar un histograma que muestre los tiempos de recorrido de tu clase.
  2. Describe la distribución de los tiempos de recorrido. Comenta sobre el centro y la dispersión de los datos, así como sobre las formas y características.
  3. Usa los datos sobre los métodos de transporte para dibujar un gráfico de barras. Incluye etiquetas en el eje horizontal.
    A blank grid with 40 horizontal units and 21 vertical units.
  4. Describe lo que aprendiste sobre los métodos de transporte que usan en tu clase para ir a la escuela. Comenta sobre cualquier patrón que hayas observado.
  5. Compara el histograma y el gráfico de barras que dibujaron. ¿En qué se parecen? ¿En qué son diferentes?



Usa una de estas sugerencias (o invéntate unas). Busca estos datos para crear un histograma. Después, describe la distribución.

  • Las estaturas de 30 atletas de varios deportes.
  • Las estaturas de 30 atletas del mismo deporte.
  • Temperaturas altas para cada día del último mes en una ciudad que te gustaría visitar.
  • Los precios de todos los artículos en el menú de un restaurante local.

Resumen

Podemos describir la forma y las características de la distribución que se muestra en un histograma. Estas son dos distribuciones con formas y características muy distintas.

Two histograms, labeled “A” and “B.”
  • El histograma A es muy simétrico y tiene un pico cerca de 21. El histograma B no es simétrico y tiene dos picos, uno cerca de 11 y uno cerca de 25.
  • El histograma B tiene dos agrupaciones. Una agrupación se forma cuando muchos datos están cerca de un cierto valor (o una vecindad de valores) en la recta numérica.
  • El histograma B también tiene un hueco entre 20 y 22. Un hueco muestra un rango en el cual no hay datos con valores en ese rango.

Este es un gráfico de barras que muestra las razas de 30 perros, y este es un histograma que muestra sus pesos.

Aunque los gráficos de barras e histogramas se ven parecidos, en realidad son muy diferentes.

  • Los gráficos de barras representan datos categóricos. Los histogramas representan datos numéricos.
  • Los gráficos de barras tiene espacios entre las barras. Los histogramas muestran un espacio entre las barras solo cuando no hay datos con valores entre las barras.
  • Las barras en los gráficos de barras pueden estar en cualquier orden. Los histogramas deben estar en orden numérico.
  • En un gráfico de barras, el número de barras depende del número de categorías. En un histograma podemos escoger cuántas barras queremos usar.

Entradas del glosario

  • centro

    El centro de un conjunto de datos numéricos es un valor en el medio de la distribución. Este valor representa un valor típico para el conjunto de datos.

    Por ejemplo, el centro de esta distribución de pesos de gatos se encuentra entre 4.5 y 5 kilogramos.

  • dispersión

    La dispersión de un conjunto de datos numéricos nos dice qué tan separados están los valores.

    Por ejemplo, estos dos diagramas de puntos muestran que las duraciones de viaje de los estudiantes de Sudáfrica están más dispersas que las de los estudiantes de Nueva Zelanda.

  • distribución

    La distribución nos dice cuántas veces que aparece cada valor en un conjunto de datos. Por ejemplo, en el conjunto de datos "azul, azul, verde, azul, naranja", la distribución es 3 azules, 1 verde y 1 naranja.

    Este diagrama de puntos muestra la distribución del conjunto de datos 6, 10, 7, 35, 7, 36, 32, 10, 7, 35.

  • frecuencia

    La frecuencia de un valor es el número de veces que aparece en el conjunto de datos.

    Por ejemplo, había 20 perros en un parque. La tabla muestra la frecuencia de cada color de perro.

    color frecuencia
    blanco 4
    marrón 7
    negro 3
    multicolor 6
  • histograma

    Un histograma es una forma de representar datos sobre una recta numérica. Los datos se agrupan en rangos de valores. La altura de la barra muestra el número de datos que se encuentran en ese rango de valores.

    Por ejemplo, este histograma muestra que hubo 10 personas que recibieron 2 o 3 boletos. No podemos saber cuántas personas recibieron exactamente 2 boletos, o cuántas personas recibieron exactamente 3 boletos. Cada barra incluye el valor del extremo izquierdo pero no el valor del extremo derecho. (Hubo 12 personas que recibieron 4 o 5 boletos y 13 personas que recibieron 6 o 7 boletos.)