Sesión 1: La Tiranía del Promedio

Caso de Política Pública

Un municipio está diseñando un programa de subsidios alimentarios para hogares vulnerables. El informe técnico reporta que el ingreso promedio per cápita es de $420 USD/mes. El Secretario de Desarrollo Social propone establecer el umbral de elegibilidad en $250 USD/mes.

Tu tarea: Analizar la distribución de ingresos para determinar: - ¿Cuántos hogares califican para el subsidio? - ¿El promedio representa bien a la población? - ¿Hay diferencias importantes entre zonas urbanas y rurales?


Parte 1: Carga y Exploración de Datos

Pregunta de reflexión: ¿Por qué simulamos una distribución log-normal en vez de una normal? ¿Qué implica esto sobre la realidad del ingreso?


Parte 2: Estadísticas Descriptivas Básicas

Para discutir: Si el promedio es $420 pero la mediana es menor, ¿qué implica esto para el diseño del programa?


Parte 3: Análisis por Percentiles (Las Colas Importan)

Ejercicio práctico: 1. ¿Qué porcentaje de hogares gana menos de $250/mes? 2. ¿Deberíamos usar P10 o P25 como criterio de elegibilidad?


Parte 4: Comparación por Zona (Urbano vs Rural)

Interpretación clave: - ¿En qué zona hay mayor desigualdad interna? - ¿Deberían ser diferentes los criterios de elegibilidad por zona?


Parte 5: Visualización 1 - Histograma

Pregunta de análisis: ¿Qué nos dice la forma de este histograma sobre la distribución del ingreso?


Parte 6: Visualización 2 - Boxplot Comparativo

Elementos del boxplot: - Línea central: mediana (P50) - Caja: contiene el 50% central de los datos (P25 a P75) - Bigotes: se extienden hasta 1.5×IQR - Puntos rojos: valores atípicos (outliers)


Parte 7: Análisis de Elegibilidad

Pregunta de política: - ¿Qué umbral recomendarías y por qué? - ¿Cómo balanceas cobertura vs. recursos disponibles?


Parte 8: Tabla Resumen para Memo Ejecutivo


Parte 9: Recomendación Basada en Evidencia


Ejercicio Individual (Entregable)

Instrucciones:

  1. Crea una tabla comparando las siguientes estadísticas para zona urbana vs rural:
    • Media, Mediana, P10, P90, IQR
    • Interpreta: ¿Dónde hay mayor desigualdad interna?
  2. Genera un histograma del ingreso solo para zona rural:
    • Incluye líneas de referencia (media, mediana, umbral)
    • Escribe un título-conclusión de máximo 18 palabras
  3. Propón un criterio de elegibilidad basado en percentiles:
    • Justifica tu elección en 6 líneas
    • Incluye al menos 1 limitación de tu propuesta
    • Evita usar “promedio” como criterio único
  4. Responde:
    • ¿Qué riesgo operativo implica usar solo el promedio para diseñar política?
    • ¿Por qué importa ver la “cola” de la distribución (P10 y P90)?

Preguntas de Discusión

  1. Focalización vs Universalidad: Si tuvieras presupuesto para solo el 20% más pobre, ¿usarías P10 o P20 como corte? ¿Por qué?

  2. Denominador: ¿Debería calcularse el ingreso per cápita o por hogar? ¿Qué cambia?

  3. Errores de inclusión/exclusión: ¿Preferirías un umbral que excluya a algunos elegibles (error tipo II) o que incluya a algunos no elegibles (error tipo I)?

  4. Evidencia incompleta: Si no tienes datos de ingreso informal, ¿cómo afecta esto tu recomendación? ¿Serías más conservador o más agresivo con el umbral?


Recursos Adicionales

Conceptos clave para recordar:

  • Media vs Mediana: En distribuciones asimétricas, la mediana es más robusta
  • Percentiles: Lenguaje para describir posiciones en la distribución
  • IQR: Mide dispersión sin ser afectado por outliers
  • Coeficiente de Variación: Dispersión relativa (> 30% = alta heterogeneidad)
  • Histograma: Muestra la forma completa de la distribución
  • Boxplot: Ideal para comparar grupos y detectar outliers

Para profundizar: - Busca “Anscombe’s Quartet” para ver por qué siempre hay que visualizar - Lee sobre “Simpson’s Paradox” (lo veremos en sesión 10) - Investiga cómo se calcula la línea de pobreza en tu país


Última reflexión: En política pública, un solo número (el promedio) puede ocultar más de lo que revela. La distribución completa importa.