Inferencia causal asistida por IA: uso de LLM para revolucionar la selección de variables instrumentales

La endogeneidad presenta un desafío importante a la hora de realizar inferencias causales en entornos de observación. Los investigadores de ciencias sociales, estadística y campos relacionados han desarrollado varias estrategias de identificación para superar este obstáculo recreando las condiciones naturales de los experimentos. El método de variables instrumentales (IV) se ha convertido en un enfoque líder, ya que los investigadores descubren IV en diversos entornos y justifican su cumplimiento de restricciones de exclusión. Sin embargo, estas restricciones de exclusión son suposiciones fundamentalmente no comprobables, que a menudo se basan en argumentos retóricos específicos de cada contexto. El proceso de identificación de posibles IV exige razonamiento contrafáctico, creatividad y, a veces, suerte de los investigadores, lo que contribuye a la naturaleza heurística de la investigación dirigida por humanos. Este enfoque subjetivo y no estadístico de la selección y justificación de IV resalta la necesidad de métodos más rigurosos y sistemáticos en la inferencia causal.

Los modelos de lenguaje grande (LLM) se han convertido en una herramienta prometedora para descubrir nuevos IV en la investigación de inferencia causal. Un investigador de la Universidad de Bristol muestra que estos sistemas de inteligencia artificial, con sus capacidades avanzadas de procesamiento del lenguaje, pueden ayudar a buscar IV válidos y proporcionar justificaciones retóricas, similares a los investigadores humanos, pero a un ritmo exponencialmente más rápido. Los LLM pueden explorar un vasto espacio de búsqueda, realizar búsquedas sistemáticas de hipótesis y participar en razonamientos contrafactuales, lo que los hace muy adecuados para tareas de inferencia causal. Este enfoque asistido por IA ofrece varios beneficios: permite búsquedas rápidas y sistemáticas adaptables a entornos de investigación específicos, aumenta la probabilidad de obtener múltiples IV para pruebas de validez formal y mejora las posibilidades de encontrar o guiar la construcción de datos relevantes que contengan IV. El método propuesto implica construir cuidadosamente indicaciones que guíen a los LLM en la búsqueda de candidatos IV válidos, incorporando traducciones verbales de restricciones de exclusión y empleando técnicas de juego de roles para imitar los procesos de toma de decisiones de los agentes.

La metodología propuesta emplea ChatGPT-4 (GPT4) de OpenAI para descubrir IV en tres ejemplos bien conocidos de la economía empírica: retornos de la escolarización, funciones de producción y efectos entre pares. El enfoque implica la construcción de indicaciones específicas que guían a GPT4 en la búsqueda de candidatos IV válidos, incorporando traducciones verbales de restricciones de exclusión y utilizando técnicas de juego de roles para simular los procesos de toma de decisiones de los agentes. Este método ha generado con éxito listas de IV candidatos, incluidas sugerencias únicas y variables utilizadas popularmente en la literatura, junto con los fundamentos de su validez. El concepto se extiende más allá del descubrimiento IV a otros métodos de inferencia causal, como la búsqueda de variables de control en métodos de regresión y diferencias en diferencias y la identificación de variables corrientes en diseños de regresión discontinua. Si bien las listas generadas no son definitivas, sirven como puntos de referencia valiosos para inspirar a los investigadores sobre posibles variables y dominios a explorar. El diálogo con GPT4 también puede ayudar a los investigadores a refinar los argumentos a favor de la validez de las variables, enfatizando el potencial de colaboración entre los investigadores humanos y la IA para mejorar las metodologías de inferencia causal.

La metodología propuesta emplea un enfoque de dos pasos para el descubrimiento de IV utilizando LLM. En el Paso 1, se solicita al LLM que busque IV que satisfagan las descripciones verbales de restricción de exclusión (i) y condición de relevancia. El Paso 2 refina la búsqueda seleccionando IV del Paso 1 que cumplan con la descripción verbal de restricción de exclusión (ii). Ambos pasos implican declaraciones contrafácticas y requieren que el LLM proporcione los fundamentos de sus respuestas. Este enfoque de dos pasos ofrece varias ventajas: mejora el rendimiento del LLM al dividir tareas complejas, permite que el usuario inspeccione los resultados intermedios y proporciona información valiosa a través de estos resultados intermedios. Las indicaciones se construyen inicialmente sin covariables para simplificar, y más adelante se introducen indicaciones más realistas que incorporan covariables. Este método crea un marco flexible para el descubrimiento IV, lo que permite realizar ajustes y adaptarse a contextos de investigación específicos, manteniendo al mismo tiempo un enfoque sistemático de la inferencia causal.

Esta investigación sirve como base para integrar los LLM en el descubrimiento de variables instrumentales en la inferencia causal. Las direcciones futuras para la sofisticación incluyen la incorporación de IV conocidos de la literatura para guiar a los LLM en el descubrimiento de otros nuevos, utilizando potencialmente el aprendizaje de pocas oportunidades para mejorar el rendimiento. Además, explorar métodos para agregar resultados en múltiples sesiones de LLM podría tener en cuenta y explotar la aleatoriedad inherente en los resultados de LLM. Estos avances podrían conducir a procesos de descubrimiento de IV más sólidos y completos. A medida que la IA continúa evolucionando, la colaboración entre investigadores humanos y sistemas de IA en metodologías de inferencia causal promete abrir nuevas vías para una investigación empírica más eficiente y reveladora en economía y campos relacionados.

Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 50.000 ml

¿Está interesado en promocionar su empresa, producto, servicio o evento ante más de 1 millón de desarrolladores e investigadores de IA? ¡Colaboremos!

Asjad es consultor interno en Marktechpost. Está cursando B.Tech en ingeniería mecánica en el Instituto Indio de Tecnología, Kharagpur. Asjad es un entusiasta del aprendizaje automático y el aprendizaje profundo que siempre está investigando las aplicaciones del aprendizaje automático en la atención médica.