Tema 8: Inferencia Estadística y Repaso General
Resumen Ejecutivo
En esta última sesión del año, se concluye el Tema 8 sobre inferencia estadística, profundizando en la estimación puntual y el cálculo de intervalos de confianza para la media poblacional. Se explican detalladamente los procedimientos de tipificación en la distribución normal y cómo determinar el tamaño muestral necesario para un error máximo dado. Finalmente, se resuelven ejercicios prácticos tipo examen que ilustran el cálculo de probabilidades y valores críticos en contextos reales.
Conceptos Clave
- Inferencia Estadística: Proceso de extraer conclusiones sobre una población a partir de una muestra.
- Estimación Puntual: Obtención de un único valor para estimar un parámetro poblacional (ej. media muestral \(\bar{x}\) para estimar \(\mu\)).
- Cuasivarianza (\(s^2\)): Estimador insesgado de la varianza poblacional, donde se divide por \(n-1\) en lugar de \(n\).
- Intervalo de Confianza: Rango de valores en el que se espera encontrar el parámetro poblacional con una cierta probabilidad (nivel de confianza).
- Nivel de Confianza (\(1-\alpha\)): Probabilidad de que el intervalo contenga el parámetro.
- Nivel de Significación (\(\alpha\)): Probabilidad de error (quedar fuera del intervalo).
- Tipificación: Transformación de una variable normal \(X \sim N(\mu, \sigma)\) a la normal estándar \(Z \sim N(0, 1)\) mediante \(Z = \frac{X - \mu}{\sigma}\).
- Error Máximo (\(E\)): La mitad de la amplitud del intervalo de confianza.
Desarrollo del Temario
1. Estimación Puntual y Muestras
La inferencia trabaja con muestras para sacar conclusiones de poblaciones inmanejables. * Media Muestral (\(\bar{x}\)): Es el mejor estimador para la media poblacional. * Varianza: Para la población es \(\sigma^2\). Para la muestra, usamos la cuasivarianza (\(s^2\)) como estimador, cuya fórmula divide por \(n-1\): $\(s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}\)$
2. Intervalos de Confianza para la Media
Se busca un rango centrado en la media muestral: \((\bar{x} - E, \bar{x} + E)\). * Fórmula del Intervalo (para muestras grandes o población normal con \(\sigma\) conocida): $\((\bar{x} - z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}, \quad \bar{x} + z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}})\)$ Donde: * \(z_{\alpha/2}\) es el valor crítico en la tabla normal estándar que deja una probabilidad de \(\alpha/2\) a la derecha. * \(\frac{\sigma}{\sqrt{n}}\) es la desviación típica de la media.
¡OJO AL DATO!: El Nivel de Confianza es \(1-\alpha\) (suele ser alto, ej. 0.95, 0.99). El Nivel de Significación es \(\alpha\) (el complementario, ej. 0.05, 0.01). Para buscar en la tabla de la Normal, buscamos la probabilidad \(1 - \alpha/2\) (o \(1-\alpha + \alpha/2\)).
3. Cálculo del Tamaño de la Muestra (\(n\))
A menudo se pide calcular cuántos individuos necesitamos encuestar para no superar un cierto error. Despejando de la fórmula del error \(E = z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\):
Ejemplo de Clase (Mástiles): * Datos: \(\sigma = 8\) cm, Error máximo \(E < 1\) cm, Nivel de significación 10% (\(\alpha = 0.1\)). * Cálculo de \(z_{\alpha/2}\): Si \(\alpha = 0.1 \rightarrow \alpha/2 = 0.05\). Buscamos en tabla \(1 - 0.05 = 0.95\). El valor \(z\) correspondiente es 1.645. * Cálculo de \(n\): $\(n = \left( \frac{1.645 \cdot 8}{1} \right)^2 \approx 173.18\)$ * Resultado: Se necesita una muestra de al menos 174 unidades.
4. ¡Material Exclusivo Tipo Examen!
Este ejercicio fue dictado íntegramente por el profesor durante la sesión y no aparece en las diapositivas. Simula la dificultad real de los problemas prácticos que encontrarás en el examen final, combinando la tipificación con el cálculo inverso de probabilidades.
Enunciado del Problema
El tiempo que tardan los estudiantes en realizar un examen sigue una distribución Normal con los siguientes parámetros: * Media (\(\mu\)): 72 minutos. * Desviación Típica (\(\sigma\)): 8 minutos.
A. Probabilidad de terminar antes de tiempo
Pregunta: Calcule la probabilidad de que un estudiante termine el examen en menos de 60 minutos.
Resolución Paso a Paso:
- Identificar la incógnita: Nos piden \(P(X < 60)\).
-
Tipificar (Estandarizar): Convertimos la variable \(X\) a la normal estándar \(Z\) usando la fórmula: $\(z = \frac{x - \mu}{\sigma}\)$
Sustituyendo valores: $\(z = \frac{60 - 72}{8} = \frac{-12}{8} = -1,5\)$
-
Ajustar para uso de Tablas: Buscamos \(P(Z < -1,5)\). Como las tablas estándar no suelen mostrar valores negativos, usamos la simetría de la Campana de Gauss.
- La probabilidad de ser menor que -1,5 es idéntica a la probabilidad de ser mayor que 1,5.
- \(P(Z < -1,5) = P(Z > 1,5)\).
-
Cálculo Final: Como la tabla da el área acumulada a la izquierda (menor que), calculamos el complemento: $\(P(Z > 1,5) = 1 - P(Z < 1,5)\)$
Consultando la tabla para \(z=1,5\), el valor es aproximadamente \(0,9332\). $\(1 - 0,9332 = 0,0668\)$
Resultado: Existe un 6,68% de probabilidad.
B. Probabilidad de tardar demasiado
Pregunta: Calcule la probabilidad de que un estudiante tarde 90 minutos o más.
Resolución Paso a Paso:
- Identificar la incógnita: Nos piden \(P(X \ge 90)\).
-
Tipificar: $\(z = \frac{90 - 72}{8} = \frac{18}{8} = 2,25\)$
-
Ajustar para uso de Tablas: Nos piden la cola derecha \(P(Z \ge 2,25)\). Calculamos el complemento del área acumulada: $\(1 - P(Z < 2,25)\)$
-
Cálculo Final: Consultando la tabla para \(z=2,25\), el valor es \(0,9878\). $\(1 - 0,9878 = 0,0122\)$
Resultado: Solo un 1,22% de los estudiantes tarda 90 minutos o más.
C. Cálculo de Percentiles ("Corte de lentitud")
Pregunta: ¿A partir de qué tiempo se considera que un estudiante es "lento", si solo el 15% de los estudiantes tarda más que ese tiempo?.
Resolución Paso a Paso:
-
Planteamiento Inverso: Buscamos un valor temporal \(x\) que deje al 15% de la población por encima (a su derecha). $\(P(X > x) = 0,15\)$
Esto equivale a decir que el 85% de los estudiantes termina antes que ese tiempo: $\(P(X < x) = 0,85\)$
-
Buscar Z en la tabla: En lugar de buscar un valor en los bordes (ejes), buscamos la probabilidad 0,8500 dentro del cuerpo de la tabla para ver a qué \(z\) corresponde.
- El valor asociado es aproximadamente 1,04.
-
Despejar X ("Destipificar"): Usamos la fórmula de la tipificación despejando la \(x\): $\(1,04 = \frac{x - 72}{8}\)$ $\(x = (1,04 \cdot 8) + 72\)$ $\(x = 8,32 + 72\)$
Resultado: A partir de 80,32 minutos se considera que un estudiante va lento.
Preguntas de Autoevaluación
- ¿Cuál es la diferencia entre varianza poblacional (\(\sigma^2\)) y cuasivarianza muestral (\(s^2\)) en cuanto a su fórmula?
- Si aumentamos el nivel de confianza (ej. de 95% a 99%) manteniendo el tamaño de la muestra, ¿qué le ocurre a la amplitud del intervalo de confianza? (¿Se hace más grande o más pequeño?)
- Para una distribución \(N(100, 15)\), ¿cuál es el valor \(Z\) tipificado para una observación de 130?
- ¿Qué valor de probabilidad debemos buscar en la tabla de la Normal estándar para hallar el valor crítico \(z_{\alpha/2}\) si el nivel de confianza es del 90%?
Nota del Profesor: "La parte del test en el examen es muy fácil, partís con un 2.5 o 3 asegurado. Los ejercicios prácticos serán muy parecidos al del tiempo del examen (Tipificación)." ¡Mucho ánimo y Feliz Navidad!