Lección 4

La forma de las distribuciones

  • Exploremos datos y describamos distribuciones.

4.1: Cuál es diferente: La forma de una distribución

¿Cuál es diferente?

A.

Dot plot from negative 21 to negative 9 by 1’s. Beginning at negative 21, number of dots above each increment is 0, 1, 1, 2, 3, 4, 5, 5, 4, 3, 2, 1, 0.

B.

Dot plot from negative 21 to negative 9 by 1's. Beginning at negative 21, number of dots above each increment is 0, 6, 4, 3, 2, 1, 1, 2, 3, 4, 6, 0, 0.
 

C.

Dot plot from negative 21 to negative 8 by 1’s. Beginning at negative 21, number of dots above each increment is 0, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 0.

D.

Dot plot from negative 21 to negative 9 by 1’s. Beginning at negative 21, number of dots above each increment is 0, 1, 1, 1, 1, 2, 3, 4, 6, 7, 4, 3, 0.

4.2: Emparejemos distribuciones

Por turnos con tu compañero, empareja 2 representaciones que representen la distribución del mismo conjunto de datos.

  1. Para cada pareja que encuentres, explícale a tu compañero cómo sabes que esas distribuciones van juntas.
  2. Escucha con atención la explicación de tu compañero sobre cada una de las parejas que encuentra. Si están en desacuerdo, discutan sus ideas y trabajen para llegar a un acuerdo.
  3. Cuando termines de hacer las diez parejas, describe la forma de cada distribución.

4.3: ¿De dónde viene la distribución?

Tu profesor te va a asignar algunas de las distribuciones que ya emparejaron. Usa la información que hay en las representaciones gráficas de los datos para pensar en una pregunta de encuesta que haya podido producir estos datos. Prepárate para compartir tu razonamiento.



Esta distribución muestra la longitud, en pulgadas, de algunos peces que fueron pescados y luego liberados en un lago cercano.

Histogram. Length of fish in inches. Height of each interval bar as follows: 5, 10, 15, 25, 20, 15, 5, 2, 0, 1, 5, 10, 20, 28, 15, 10, 5, 2, 2.
  1. Describe la forma de la distribución.

  2. Haz una suposición fundamentada sobre posibles causas por las cuales la distribución tiene esa forma.

 

Resumen

Podemos describir la forma de las distribuciones usando los términos: simétrica, asimétrica, en forma de campana, bimodal o uniforme. Estos son un diagrama de puntos, un histograma y un diagrama de caja que representan la distribución del mismo conjunto de datos. Este conjunto de datos tiene una distribución simétrica.

Dot plot from 6 to 18 by 1’s. Beginning at 6, number of dots above each increment is 0, 1, 1, 2, 3, 5, 8, 5, 3, 2, 1, 1, 0.
Histogram from 6 to 18 by 2’s. Beginning at 6 up to but not including 8, height of bar at each interval is 1, 3, 8, 10, 5, 2
Box plot from 6 to 18 by 1’s. Whisker from 7 to 11. Box from 11 to 13 with vertical line at 12. Whisker from 13 to 17.

En una distribución simétrica, la media es igual a la mediana y hay una línea de simetría vertical en el centro de la representación de los datos. El histograma y el diagrama de caja agrupan datos. Como los histogramas y los diagramas de caja no muestran cada valor individualmente, no nos dan información sobre la forma de la distribución con el mismo nivel de detalle del diagrama de puntos. Esta distribución no solo es simétrica, sino que además tiene forma de campana. Decimos que una distribución tiene forma de campana si en su diagrama de puntos la mayoría de los datos están agrupados cerca del centro y hay menos puntos que están lejos del centro, lo que hace que el diagrama se parezca a una campana. Por esto, la medida del centro es una muy buena descripción global de los datos. Las distribuciones en forma de campana siempre son simétricas o están cerca de serlo.

Estos son un diagrama de puntos, un histograma y un diagrama de caja que representan una distribución asimétrica.

Dot plot from 8 to 18 by 1’s. Beginning at 8, number of dots above each increment is 6, 5, 4, 3, 2, 2, 1, 1, 1, 0, 0.
Histogram from 8 to 18 by 2’s. Beginning at 8 up to but not including 10, height of bar at each interval is 11, 7, 4, 2, 1.
Box plot from 8 to 18 by 1’s. Whisker from 8 to 8.5. Box from 8.5 to 12 with vertical line at 10. Whisker from 12 to 16.

En una distribución asimétrica, hay más valores lejos de la mayoría de los datos a un lado de la distribución que al otro. Esto hace que la media y la mediana no sean iguales. En esta distribución asimétrica, decimos que los datos son asimétricos a la derecha porque la mayoría de los datos están cerca del intervalo de 8 a 10, pero hay muchos puntos que están a la derecha. La media es mayor que la mediana. Los valores grandes a la derecha hacen que la media se mueva en esa dirección, mientras que la mediana se mantiene cerca de la mayoría de los datos. Así, en las distribuciones asimétricas a la derecha, la media es mayor que la mediana. En un conjunto de datos asimétrico a la izquierda sucede algo similar, pero hacia el otro lado. Nuevamente, el diagrama de puntos nos da un mayor nivel de detalle sobre la forma de la distribución que el histograma o el diagrama de caja.

En una distribución uniforme, todos los valores están distribuidos equitativamente en el rango de los datos. Esto hace que la distribución se vea como un rectángulo.

Dot plot from 7 to 19 by 1’s. Beginning at 7, number of dots above each increment is 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 0.
Histogram from 7 to 19 by 2’s. Beginning at 7 up to but not including 9, height of bar at each interval is 4.
Box plot from 7 to 19 by 1’s. Whisker from 7 to 9.5. Box from 9.5 to 15.5 with vertical line at 12.5. Whisker from 15.5 to 18.

En una distribución uniforme, la media es igual a la mediana porque una distribución uniforme es también una distribución simétrica. El diagrama de caja no nos da información suficiente para decir que la forma de la distribución es uniforme. Sin embargo, las longitudes iguales de los cuartos sugieren que la distribución puede ser aproximadamente simétrica.

Una distribución bimodal tiene dos valores muy frecuentes que se ven como dos picos distintos en un diagrama de puntos o en un histograma.

Dot plot from 6 to 20 by 1’s. Beginning at 6, number of dots above each increment is 0, 5, 2, 2, 1, 1, 1, 1, 1, 1, 2, 2, 4, 1, 0.
Histogram from 6 to 20 by 2’s. Beginning at 6 up to but not including 8, height of bar at each interval is 5, 4, 2, 2, 2, 4, 5.
Box plot from 6 to 20 by 1’s. Whisker from 7 to 8. Box from 8 to 17 with vertical line at 12.5. Whisker from 17 to 19.

A veces, la mayoría de los datos de una distribución bimodal están agrupados en el medio de la distribución. En estos casos, el centro de la distribución no describe muy bien los datos. Las distribuciones bimodales no siempre son simétricas. Por ejemplo, puede que los picos no estén igual de lejos del medio de la distribución o puede que haya otros valores que dañan la simetría.

Entradas del glosario

  • distribución asimétrica

    Una distribución en la que hay más valores alejados de la mayoría de los datos en un lado, por lo que la media no es igual a la mediana. En el diagrama de puntos que se muestra, los valores a la izquierda, como 1, 2 y 3, están más lejos de la mayoría de los datos que los valores a la derecha.

  • distribución bimodal

    Una distribución que tiene dos valores muy frecuentes. En un diagrama de puntos o histograma estos se ven como picos distintos. En el diagrama de puntos que se muestra, los dos valores frecuentes son 2 y 7.

  • distribución en forma de campana

    Una distribución que tiene un diagrama de puntos o un histograma en forma de campana, en la que la mayoría de los datos se encuentran agrupados cerca del centro y pocos puntos están lejos del centro. 

  • distribución simétrica

    Una distribución que tiene una línea de simetría en el centro de la representación gráfica, por lo cual la media es igual a la mediana. En el diagrama de puntos que se muestra, la distribución es simétrica con respecto al valor 5.

  • distribución uniforme

    Una distribución en la que los valores están distribuidos de manera equitativa en todo el rango.