Ejercicio Aplicado: Muestreo y el Teorema del Límite Central

Programa Becas para Todos - Análisis de Asistencia Escolar

Contexto

El programa “Becas para Todos” otorga transferencias condicionadas a familias de bajos recursos. La condición: sus hijos deben asistir al menos 85% de los días escolares.

Pregunta de política: ¿Cuál es la tasa promedio de asistencia escolar en la población?

Desafío: No podemos encuestar a las 2.5 millones de familias beneficiarias. Debemos usar una muestra.


Parte 1: La Población Verdadera (Desconocida en la Realidad)


Parte 2: Visualizar la Distribución Poblacional


Parte 3: Tomar UNA Muestra


Parte 4: Teorema del Límite Central en Acción

Pregunta: Si la población es asimétrica, ¿qué pasa con la distribución de \(\bar{x}\)?

Experimento: Tomar 1000 muestras diferentes, calcular \(\bar{x}\) en cada una.


Parte 5: Visualización del Teorema del Límite Central


Parte 6: Comparación Visual del Error Estándar


Parte 7: Verificación Numérica del Teorema


Preguntas para Reflexionar

  1. ¿Por qué es importante el TLC?
    Nos permite usar la distribución normal para hacer inferencia, aunque la población no sea normal.

  2. ¿Qué tan grande debe ser \(n\)?
    Regla general: \(n \geq 30\) es suficiente para que \(\bar{x}\) sea aproximadamente normal, incluso si la población es muy asimétrica.

  3. ¿Qué pasa si tomo una muestra sesgada?
    El TLC NO corrige sesgo. Solo reduce varianza. Una muestra mal diseñada de 10,000 familias es peor que una muestra bien diseñada de 500.

  4. ¿Cuántas familias debo encuestar?
    Depende del margen de error aceptable. Con \(n = 500\), el SE es ~0.8%. Con \(n = 100\), el SE es ~1.8%.


Ejercicio Individual

Modifica el código anterior para:

  1. Cambiar la distribución poblacional a una exponencial (muy asimétrica)
  2. Calcular el tamaño de muestra necesario para \(SE \leq 1\%\)
  3. Simular muestreo estratificado (separar familias urbanas y rurales)

Conclusión

Teorema del Límite Central: La distribución de \(\bar{x}\) es normal, incluso si la población no lo es

Error Estándar: \(SE = \sigma / \sqrt{n}\) disminuye con \(\sqrt{n}\)

Implicación práctica: Con \(n\) suficientemente grande, podemos usar ICs y pruebas de hipótesis basadas en la normal

⚠️ Advertencia: TLC NO corrige sesgo de selección