Lección 4

Modelos lineales

  • Exploremos relaciones entre dos variables numéricas.

Problema 1

Cada punto del diagrama de dispersión muestra el número de veces que un jugador tuvo un turno al bate y el número de hits que logró el jugador.

A scatter plot. Horizontal, 0 to 600, by 50’s, labeled at bats. Vertical, 0 to 150, by 12 point 5’s, labeled hits. 19 dots trend linearly up and to the right.

El diagrama de dispersión incluye un punto en \((318,80)\). Describe el significado de este punto en la situación.

Problema 2

Cada punto del diagrama de dispersión muestra el número de minutos que una persona tuvo que esperar para que la atendieran en un restaurante y el número de empleados disponibles en ese momento.

A scatter plot. Horizontal, 0 to 9, by point 5’s, labeled staff. Vertical, 0 to 13, by point 5’s, labeled wait time. 10 dots trend linearly down and to the right.

Una recta que modela los datos está dada por la ecuación \(y = \text{-}1.62 x + 18\), donde \(y\) representa el tiempo de espera y \(x\) representa el número de empleados disponibles.

  1. La pendiente de la recta es -1.62. ¿Qué significa la pendiente en esta situación? ¿Es esto razonable?
  2. La intersección con el eje \(y\) es \((0,18)\). ¿Qué significa la intersección en esta situación? ¿Es esto razonable?

Problema 3

Un taxista registra el tiempo que tarda en completar varios recorridos y la distancia de cada uno.

A scatter plot. Horizontal, 0 to 80, by 5’s, labeled time in minutes. Vertical, 0 to 40, by 5’s, labeled distance in miles. 14 dots trend linearly up and to the right with a line a best fit.

La recta de mejor ajuste está dada por la ecuación \(y = 0.467x + 0.417\), donde \(y\) representa la distancia en millas, y \(x\) representa el tiempo del recorrido en minutos.

  1. Usa la recta de mejor ajuste para estimar la distancia de un recorrido que tarda 20 minutos. Muestra tu razonamiento.
  2. Usa la recta de mejor ajuste para estimar el tiempo que tarda en hacer un recorrido de 6 millas de longitud. Muestra tu razonamiento.

Problema 4

Se recolectan datos acerca del número de victorias y derrotas de una muestra aleatoria de equipos cuya mascota es un animal y de otros equipos que tienen otro tipo de mascota. Las frecuencias relativas por columna se muestran en la tabla. Según la información de la tabla, ¿hay una asociación entre las variables? Explica tu razonamiento.

mascota animal otro tipo de mascota
victorias 74% 49%
derrotas 26% 51% 

(de la Unidad 3, Lección 3.)

Problema 5

Una muestra aleatoria de administradores de piscinas responde a una encuesta acerca de cuántas personas de cada grupo de edad nadan en los distintos tipos de piscinas (cubiertas o al aire libre). Los resultados de la encuesta se muestran en la tabla de doble entrada. Según estos datos, ¿parece haber una asociación entre el tipo de piscina y el grupo de edad? Explica tu razonamiento. 

piscina al aire libre piscina cubierta
menor de 18 años 317 41
18 años o más 352 163

 

(de la Unidad 3, Lección 3.)

Problema 6

Se recolectan datos de una muestra aleatoria de personas acerca de cómo ven películas de los géneros de acción y misterio. ¿Cuál de estos valores iría mejor en la celda en blanco para que la tabla no parezca indicar que hay una asociación entre el género de la película y cómo se accede a ella? 

por internet alquiler en tienda física
acción 526 147
misterio 317

 

A:

19

B:

89

C:

147

D:

320

(de la Unidad 3, Lección 3.)