Lección 6

Residuos

  • Analicemos qué tan cerca están los datos de un modelo lineal.

6.1: Conversación matemática: Diferencias entre lo que se espera

En cada caso, calcula mentalmente qué tan cerca del valor real está la estimación usando esta diferencia: \(\text{valor real} - \text{valor estimado}\).

Valor real: 24.8 gramos. Valor estimado: 19.6 gramos.

Valor real: \$112.11. Valor estimado: \$109.30.

Valor real: 41.5 centímetros. Valor estimado: 45.90 centímetros.

Valor real: -1.34 grados Celsius. Valor estimado: -2.45 grados Celsius.

6.2: El regreso de las naranjas

Video still of oranges being weighed

Usa estos datos del video sobre pesar naranjas para responder las preguntas.

número de naranjas peso en kilogramos
3 1.027
4 1.162
5 1.502
6 1.617
7 1.761
8 2.115
9 2.233
10 2.569
  1. Usa tecnología para hacer un diagrama de dispersión de los pesos de las naranjas y para encontrar la recta de mejor ajuste.
  2. De acuerdo al modelo lineal, ¿cuál es el peso estimado de la caja de naranjas para cada una de estas cantidades de naranjas?
    número de naranjas peso real en kilogramos estimación lineal del peso en kilogramos
    3 1.027
    4 1.162
    5 1.502
    6 1.617
    7 1.761
    8 2.115
    9 2.233
    10 2.569
  3. Compara los pesos de la caja que tiene 3 naranjas y el peso estimado de la caja que tiene 3 naranjas. Explica o muestra tu razonamiento.
  4. ¿Cuántas naranjas hay en la caja cuando el modelo lineal hace la mejor estimación del peso? Explica o muestra tu razonamiento.
  5. ¿Cuántas naranjas hay en la caja cuando el modelo lineal hace la estimación menos acertada del peso? Explica o muestra tu razonamiento.
  6. La diferencia entre el valor real y el valor estimado por un modelo lineal se llama el residuo. Si el valor real es mayor que el valor estimado, el residuo es positivo. Si el valor real es menor que el valor estimado, el residuo es negativo. Si consideramos el conjunto de datos del peso de las naranjas, ¿cuál es el residuo, con respecto a la recta de mejor ajuste, cuando hay 3 naranjas?
  7. Se pueden graficar todos los residuos a la vez usando tecnología digital. Revisa el gráfico de los residuos. Cuando se grafican en los mismos ejes del diagrama de dispersión, ¿cuáles son las coordenadas del punto donde \(x = 8\) y \(y\) es igual al valor del residuo?
  8. ¿Cuál punto del diagrama de dispersión tiene el residuo más cercano a cero? ¿Qué nos dice esto acerca del peso de la caja que corresponde a ese punto?
  9. ¿Cómo puedes usar los residuos para decidir qué tan bien se ajusta la recta a los datos?

6.3: Mejores residuos

  1. Emparejen cada diagrama de dispersión (el cual incluye un modelo lineal) con un gráfico de los residuos.
  2. Volteen las tarjetas de los diagramas de dispersión de tal manera que solo se vean las gráficas de los residuos. Basándose en los residuos, ¿con cuál recta se obtendrían las estimaciones más precisas? ¿Cuál recta se ajusta peor a sus datos?


  1. Tyler estima una recta de mejor ajuste para algunos datos sobre la masa, en gramos, de distintas cantidades de manzanas. Este es el gráfico de los residuos.

    Graph of residuals.
    1. ¿Qué aspecto tiene la recta de Tyler según el gráfico de los residuos?
    2. ¿Qué tan bien modela los datos la recta de ajuste de Tyler? Explica tu razonamiento.
  2. Lin estima una recta de mejor ajuste para los mismos datos. El gráfico muestra los residuos.

    Graph of residuals.
    1. ¿Qué aspecto tiene la recta de Lin comparada con los datos?
    2. ¿Qué tan bien modela los datos la recta de Lin? Explica tu razonamiento.
  3. Kiran también estima una recta de mejor ajuste para los mismos datos. El gráfico muestra los residuos.

    Graph of residuals.
    1. ¿Qué aspecto tiene la recta de Kiran comparada con los datos?
    2. ¿Qué tan bien modela los datos la recta de Kiran? Explica tu razonamiento.
  4. ¿Quién tiene la mejor estimación de la recta de mejor ajuste: Tyler, Lin o Kiran? Explica tu razonamiento.

Resumen

Cuando un modelo lineal se ajusta a los datos, puede ser útil examinar los residuos. Los residuos son las diferencias que hay entre el valor de \(y\) de un punto de un diagrama de dispersión y el valor de \(y\) que el modelo lineal predice para el valor de \(x\) correspondiente.

Por ejemplo, en el diagrama de dispersión que muestra la longitud de un pez y su edad, el residuo del pez que tiene 2 años y mide 100 mm de largo es 8.06 mm, porque el punto es \((2,100)\) y el valor de la función lineal es 91.94 mm (\(34.08 \boldcdot 2 + 23.78\)) cuando \(x\) es 2. El residuo de 8.06 mm significa que el pez real es aproximadamente 8 milímetros más largo que lo que el modelo lineal estima para un pez de la misma edad.

\(y = 34.08x + 23.78\)

Scatter plot.

Cuando un punto del diagrama de dispersión está por encima de la recta, este punto tiene un residuo positivo. Cuando un punto está por debajo de la recta, su residuo es un valor negativo. Una recta que tiene residuos pequeños, probablemente produzca estimaciones más cercanas del valor real.

Entradas del glosario

  • residuo

    La diferencia entre el valor de la coordenada \(y\) de un punto de un diagrama de dispersión y el valor que predice un modelo lineal. Las longitudes de las líneas punteadas de la figura son los residuos de los distintos puntos de datos.