Ejercicio Aplicado: Muestreo y el Teorema del Límite Central
Programa Becas para Todos - Análisis de Asistencia Escolar
Contexto
El programa “Becas para Todos” otorga transferencias condicionadas a familias de bajos recursos. La condición: sus hijos deben asistir al menos 85% de los días escolares.
Pregunta de política: ¿Cuál es la tasa promedio de asistencia escolar en la población?
Desafío: No podemos encuestar a las 2.5 millones de familias beneficiarias. Debemos usar una muestra.
Parte 1: La Población Verdadera (Desconocida en la Realidad)
Parte 2: Visualizar la Distribución Poblacional
Parte 3: Tomar UNA Muestra
Parte 4: Teorema del Límite Central en Acción
Pregunta: Si la población es asimétrica, ¿qué pasa con la distribución de \(\bar{x}\)?
Experimento: Tomar 1000 muestras diferentes, calcular \(\bar{x}\) en cada una.
Parte 5: Visualización del Teorema del Límite Central
Parte 6: Comparación Visual del Error Estándar
Parte 7: Verificación Numérica del Teorema
Preguntas para Reflexionar
¿Por qué es importante el TLC?
Nos permite usar la distribución normal para hacer inferencia, aunque la población no sea normal.¿Qué tan grande debe ser \(n\)?
Regla general: \(n \geq 30\) es suficiente para que \(\bar{x}\) sea aproximadamente normal, incluso si la población es muy asimétrica.¿Qué pasa si tomo una muestra sesgada?
El TLC NO corrige sesgo. Solo reduce varianza. Una muestra mal diseñada de 10,000 familias es peor que una muestra bien diseñada de 500.¿Cuántas familias debo encuestar?
Depende del margen de error aceptable. Con \(n = 500\), el SE es ~0.8%. Con \(n = 100\), el SE es ~1.8%.
Ejercicio Individual
Modifica el código anterior para:
- Cambiar la distribución poblacional a una exponencial (muy asimétrica)
- Calcular el tamaño de muestra necesario para \(SE \leq 1\%\)
- Simular muestreo estratificado (separar familias urbanas y rurales)
Conclusión
✅ Teorema del Límite Central: La distribución de \(\bar{x}\) es normal, incluso si la población no lo es
✅ Error Estándar: \(SE = \sigma / \sqrt{n}\) disminuye con \(\sqrt{n}\)
✅ Implicación práctica: Con \(n\) suficientemente grande, podemos usar ICs y pruebas de hipótesis basadas en la normal
⚠️ Advertencia: TLC NO corrige sesgo de selección