Skip to content

Tema10

Tema 10: Probabilidad Multivariante y Relación entre Variables (Tema 10)

Esta sesión marca el cierre del contenido teórico de la asignatura. Se centra en cómo estudiar la relación simultánea entre dos o más variables, pasando del análisis univariante al multivariante, con especial énfasis en la correlación y la regresión lineal.


Resumen Ejecutivo

  1. La sesión introduce la probabilidad conjunta, que permite modelar fenómenos donde varios factores (variables) influyen al mismo tiempo.
  2. Se define la covarianza y la correlación de Pearson como herramientas para medir la fuerza y dirección de la relación lineal entre variables.
  3. Se explora la recta de regresión como el modelo matemático para predecir el valor de una variable en función de otra, minimizando el error.

Conceptos Clave

  • Vector Aleatorio: Conjunto de variables que representan diferentes factores de un mismo fenómeno.
  • Probabilidad Marginal: Probabilidad de una variable individual obtenida al sumar (o integrar) todas las demás variables en una distribución conjunta.
  • Covarianza (): Medida que indica si dos variables varían de forma conjunta.
  • Correlación de Pearson (): Índice adimensional que oscila entre y e indica la fuerza de la relación lineal.
  • Recta de Regresión: Modelo lineal que mejor se ajusta a una "nube de puntos" para realizar predicciones.

Desarrollo del Temario

1. Probabilidad Multivariante

En la realidad, los eventos no dependen de una sola variable. El profesor utiliza el ejemplo de una máquina cuya eficiencia depende de su velocidad, precisión, coste y esperanza de vida.

  • Variables Discretas: Se analizan mediante tablas de doble entrada.
  • Variables Continuas: Se definen mediante funciones de densidad conjunta y funciones de distribución (acumuladas).

Ejemplo de los Dados: Si lanzamos dos dados (uno blanco y uno negro), podemos definir dos nuevas variables: (la suma de los resultados) y (la diferencia absoluta). La probabilidad conjunta es la probabilidad de que ocurran ambos resultados específicos a la vez (ej. que la suma sea 4 y la diferencia sea 0).

2. Medias y Varianzas Marginales

Para trabajar con una sola variable dentro de un sistema multivariante, usamos las marginales.

  • En una tabla: Sumar por filas nos da la marginal de una variable; sumar por columnas nos da la de la otra.
  • ¡OJO AL DATO!: La suma total de todas las probabilidades marginales (tanto por filas como por columnas) siempre debe ser igual a 1.

3. Covarianza y Correlación

La covarianza nos dice la dirección de la relación, pero la correlación () es la que realmente "medimos" para el examen:

Valor de Interpretación
Próximo a +1 Relación lineal directa y fuerte (si una sube, la otra también).
Próximo a -1 Relación lineal inversa y fuerte (si una sube, la otra baja).
Cercano a 0 No existe relación lineal (aunque podría haber otro tipo de relación).

4. Modelo de Regresión Lineal Simple

El objetivo es encontrar la recta que minimice la distancia entre los puntos reales y la recta (minimizar los residuos).

Ecuación de la recta de regresión de sobre :

Ejemplo de Galton: El profesor cita el estudio clásico sobre la estatura. Aunque las madres altas suelen tener hijas altas, la relación no es perfecta (siempre hay un término de error ).

¡AVISO CRÍTICO DE EXAMEN!

El profesor ha confirmado lo siguiente respecto al Tema 10:

  1. NO entrarán ejercicios prácticos de desarrollo/operar sobre este tema (no habrá que calcular rectas de regresión complejas).
  2. SÍ puede entrar en el Tipo Test: Preguntas teóricas sobre la interpretación del coeficiente de correlación ( o ) y el significado de las nubes de puntos.
  3. Prioridad absoluta: Repasar los ejercicios de la Distribución Normal y los Test de Hipótesis (Tema 9), que son el núcleo de la parte práctica.

Preguntas de Autoevaluación

  1. Si el coeficiente de correlación de Pearson es , ¿cómo describirías la relación entre las variables?
  2. ¿Qué sucede con la suma de todas las probabilidades de una distribución marginal?
  3. ¿Es la recta de regresión de sobre la misma que la de sobre ? (Razona por qué no, basándote en los denominadores de la fórmula).