Lección 5
Describamos tendencias en diagramas de dispersión
Busquemos asociaciones entre variables.
5.1: ¿Cuál es diferente?: diagramas de dispersión
¿Cuál es diferente?
![Four scatterplots.](https://staging-cms-im.s3.amazonaws.com/MoppH7by3E9YwZCQwbVG2QAw?response-content-disposition=inline%3B%20filename%3D%228-8.6.B3.Image.Revision.01.png%22%3B%20filename%2A%3DUTF-8%27%278-8.6.B3.Image.Revision.01.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=12034db9defa4cb0c75abbf500bcef7b4e167c88b9ba21a1236748a878914db0)
5.2: Ajustemos rectas
Tu profesor te va a entregar una tira de pasta y una regla.
-
Estas son dos copias del mismo diagrama de dispersión. Experimenta dibujar rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
-
Estas son dos copias de otro diagrama de dispersión. Experimenta dibujando rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
- En tus propias palabras, describe los aspectos que hagan que una recta se ajuste bien a los datos.
5.3: Buen ajuste, mal ajuste
Los dos diagramas de dispersión muestran el año y el precio de los mismos 17 automóviles usados. Pero, cada diagrama de dispersión tiene un modelo diferente para la relación entre año y precio.
![](https://staging-cms-im.s3.amazonaws.com/rgSd4DwuCXMRXa47mrdHyyze?response-content-disposition=inline%3B%20filename%3D%228.6AScatter.pdf-8_es.png%22%3B%20filename%2A%3DUTF-8%27%278.6AScatter.pdf-8_es.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=c33cfbf9c8a35e01b5eebc7b5ec062613fd13d12ef6ad5c5270e5031e51f4007)
- En el diagrama A:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
- En el diagrama B:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
-
¿Para cuántos automóviles la predicción del modelo del diagrama A difiere del precio real por más de \$3,000?, ¿y para cuántos automóviles, con respecto al modelo del diagrama B?
- ¿Cuál modelo hace un mejor trabajo en predecir el precio de un automóvil usado a partir de su año?
5.4: Practiquemos cómo ajustar rectas
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
![A scatterplot, 30 points arranged very close to the line from 0 comma 0 to 10 comma 30.](https://staging-cms-im.s3.amazonaws.com/kbMUGDPVxMkfHMx3mD6DUNjf?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.03.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.03.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=3fbfc2c81ed56751bc9571c35a7bb1910a3bf10049bb0f621757de33e3ece30b)
![A scatterplot, points at x= 0 lie between negative 2 and 8, generally trend up and to the right. Points at x = 9 lie between 20 and 35.](https://staging-cms-im.s3.amazonaws.com/5t7faPLDKZNmsNpwtAvDRUHB?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.05.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.05.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=3e3ac00829926514f656224c4b43efb538050177c62299f45d1ce752d0ad011e)
![A scatterplot, points at x= 0 lie between negative 18 and negative 2, generally trend up and to the right. Points at x = 9 lie between 15 and 40.](https://staging-cms-im.s3.amazonaws.com/5d1XiFUELXNiJiQHM9E6Ha1V?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.04.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.04.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=62bf4d0825cc3432f35fe55503ea60c918811289175c79229d806d6739d3f449)
Estos diagramas de dispersión fueron hechos multiplicando la coordenada en \(x\) por 3 y luego sumando un número aleatorio entre dos valores para obtener la coordenada en \(y\). En el primer diagrama de dispersión se sumó un número entre -0.5 y 0.5 a la coordenada en \(y\). En el segundo diagrama de dispersión se sumó un número entre -2 y 2 a la coordenada en \(y\). En el tercer diagrama de dispersión se sumó un número aleatorio entre -10 y 10 a la coordenada en \(y\).
- En cada diagrama de dispersión, dibuja una recta que se ajuste a los datos.
- Explica por qué con algunas fue más fácil hacer esto que con otras.
Resumen
Cuando una función lineal se ajusta bien a los datos, decimos que hay una asociación lineal entre las variables. Por ejemplo, la relación entre altura y peso de 25 perros y la función lineal cuya gráfica se muestra junto con el diagrama de dispersión.
![](https://staging-cms-im.s3.amazonaws.com/RUbr3MDwNR5uBJ358KEEEZTA?response-content-disposition=inline%3B%20filename%3D%228.6.B2.Image.08_es%20%25281%2529.png%22%3B%20filename%2A%3DUTF-8%27%278.6.B2.Image.08_es%2520%25281%2529.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=2edfadadf537acd846b9c9fbb37fd3f91d516970c4aca2bbaf537c122b2d3203)
Dado que el modelo se ajusta bien a los datos y que la pendiente de la recta es positiva, decimos que hay una asociación positiva entre el peso del perro y la altura del perro.
¿Cuál asociación crees que hay entre el peso de un automóvil y su eficiencia de combustible?
![](https://staging-cms-im.s3.amazonaws.com/reQLYnDsEz8BnaLojm6cvh3e?response-content-disposition=inline%3B%20filename%3D%228.6.B4.Image.03_es.png%22%3B%20filename%2A%3DUTF-8%27%278.6.B4.Image.03_es.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF37H2AMFB%2F20240722%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240722T121429Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=ff9bdf3593e0869c220639120720e741078ab0af14c7fd7c18bd0ff2ab5df3f5)
Como la pendiente de una recta que se ajusta bien a los datos es negativa, decimos que hay una asociación negativa entre la eficiencia de combustible y el peso de un automóvil.
Entradas del glosario
- asociación negativa
Una asociación negativa es una relación entre dos cantidades en la cual una tiende a disminuir cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente negativa.
Distintas tiendas en el país venden un libro a distintos precios.
El diagrama de dispersión muestra que hay una asociación negativa entre el precio del libro (en dólares) y el número de libros vendidos a ese precio.
- asociación positiva
Una asociación positiva es una relación entre dos cantidades en la cual una tiende a aumentar cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente positiva.
La relación entre la altura y el peso de 25 perros se muestra en este diagrama de dispersión. Hay una asociación positiva entre la altura del perro y el peso del perro.
- dato atípico
Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.
Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.