Alibaba Research presenta XiYan-SQL: un marco de inteligencia artificial conjunto de múltiples generadores para texto a SQL
La tecnología Natural Language to SQL (NL2SQL) ha surgido como un aspecto transformador del procesamiento del lenguaje natural (NLP), que permite a los usuarios convertir consultas en lenguaje humano en declaraciones de lenguaje de consulta estructurado (SQL). Este desarrollo ha facilitado que las personas que necesitan más experiencia técnica interactúen con bases de datos complejas y recuperen información valiosa. Al cerrar la brecha entre los sistemas de bases de datos y el lenguaje natural, NL2SQL ha abierto puertas para una exploración de datos más intuitiva, particularmente en grandes repositorios en diversas industrias, mejorando la eficiencia y las capacidades de toma de decisiones.
Un problema importante en NL2SQL radica en el equilibrio entre precisión de las consultas y adaptabilidad. Muchos métodos no logran generar consultas SQL que sean precisas y versátiles en diversas bases de datos. Algunos dependen en gran medida de modelos de lenguaje grandes (LLM) optimizados mediante ingeniería rápida, que genera múltiples resultados para seleccionar la mejor consulta. Sin embargo, este enfoque aumenta la carga computacional y limita las aplicaciones en tiempo real. Por otro lado, el ajuste fino supervisado (SFT) proporciona generación de SQL dirigido, pero necesita ayuda con aplicaciones entre dominios y operaciones de bases de datos más complejas, lo que deja un vacío para marcos innovadores.
Los investigadores han empleado previamente diversos métodos para abordar los desafíos de NL2SQL. La ingeniería rápida se centra en optimizar las entradas para generar salidas SQL con herramientas como GPT-4 o Claude 3.5 Sonnet, pero esto a menudo resulta en una inferencia ineficiente. SFT ajusta modelos más pequeños para tareas específicas, lo que produce resultados controlables pero una diversidad de consultas limitada. Los métodos híbridos como ExSL y Granite-34B-Code mejoran los resultados mediante capacitación avanzada, pero enfrentan barreras en la adaptabilidad de múltiples bases de datos. Estos enfoques existentes enfatizan la necesidad de soluciones que combinen precisión, adaptabilidad y diversidad en la generación de consultas SQL.
Se presentan los investigadores del Grupo Alibaba XiYan-SQLun marco NL2SQL innovador. Integra estrategias de conjunto de múltiples generadores y fusiona las fortalezas de la ingeniería rápida y SFT. Una innovación fundamental dentro de XiYan-SQL es M-Schema, un método de representación de esquemas semiestructurados que mejora la comprensión del sistema de las estructuras jerárquicas de las bases de datos. Esta representación incluye detalles clave como tipos de datos, claves primarias y valores de ejemplo, lo que mejora la capacidad del sistema para generar consultas SQL precisas y contextualmente apropiadas. Este enfoque permite a XiYan-SQL producir candidatos SQL de alta calidad y al mismo tiempo optimizar la utilización de recursos.
XiYan-SQL emplea un proceso de tres etapas para generar y refinar consultas SQL. En primer lugar, la vinculación de esquemas identifica elementos relevantes de la base de datos, reduciendo la información superflua y centrándose en estructuras clave. Luego, el sistema genera candidatos de SQL utilizando generadores basados en ICL y SFT. Esto garantiza diversidad en sintaxis y adaptabilidad a consultas complejas. Cada SQL generado se refina utilizando un modelo de corrección para eliminar errores lógicos o sintácticos. Finalmente, un modelo de selección, ajustado para distinguir diferencias sutiles entre los candidatos, selecciona la mejor consulta. XiYan-SQL supera los métodos tradicionales al integrar estos pasos en un proceso coherente y eficiente.
El rendimiento del marco ha sido validado mediante pruebas rigurosas en diversos puntos de referencia. XiYan-SQL logró una precisión de ejecución del 89,65% en el conjunto de pruebas Spider, superando a los modelos líderes anteriores por un margen significativo. Ganó un 69,86 % en SQL-Eval, superando a SQL-Coder-8B en más de ocho puntos porcentuales. Demostró una adaptabilidad excepcional para conjuntos de datos no relacionales, asegurando una precisión del 41,20 % en NL2GQL, la más alta entre todos los modelos probados. XiYan-SQL obtuvo un competitivo 72,23 % en el desafiante punto de referencia de desarrollo de Bird, rivalizando estrechamente con el método de mejor rendimiento, que logró un 73,14 %. Estos resultados resaltan la versatilidad y precisión de XiYan-SQL en diversos escenarios.
Las conclusiones clave de la investigación incluyen las siguientes:
- Representación de esquemas innovadora: la introducción de M-Schema mejora significativamente la comprensión de la base de datos al incluir estructuras jerárquicas, tipos de datos y claves primarias. Este enfoque reduce la redundancia y mejora la precisión de las consultas.
- Generación avanzada de candidatos: XiYan-SQL utiliza generadores ajustados y basados en ICL para producir diversos candidatos SQL. Un enfoque de capacitación multitarea mejora la calidad de las consultas en múltiples estilos sintácticos.
- Selección y corrección de errores sólidas: el marco emplea un refinador de SQL para optimizar las consultas y un modelo de selección para garantizar que se elija al mejor candidato. Este método reemplaza las estrategias de autoconsistencia menos eficientes.
- Versatilidad comprobada: las pruebas en puntos de referencia como Spider, Bird, SQL-Eval y NL2GQL demuestran la capacidad de XiYan-SQL para adaptarse a bases de datos relacionales y no relacionales.
- Rendimiento de última generación: XiYan-SQL supera constantemente a los modelos líderes, logrando puntuaciones notables como 89,65 % en Spider y 41,20 % en NL2GQL, estableciendo nuevos estándares en los marcos NL2SQL.
En conclusión, XiYan-SQL aborda los desafíos persistentes en las tareas NL2SQL combinando representación de esquemas avanzada, diversas técnicas de generación de SQL y mecanismos precisos de selección de consultas. Logra un enfoque equilibrado en cuanto a precisión y adaptabilidad, superando a los marcos tradicionales en múltiples puntos de referencia. La investigación subraya la importancia de la innovación en los sistemas NL2SQL y allana el camino para una adopción más amplia de herramientas intuitivas de interacción con bases de datos. XiYan-SQL ejemplifica cómo la integración estratégica de tecnologías puede redefinir sistemas de consulta complejos, proporcionando una base sólida para futuros avances en accesibilidad a datos.
Mira el Página de papel y GitHub. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.
(CONFERENCIA VIRTUAL DE IA GRATUITA) SmallCon: Conferencia virtual gratuita sobre GenAI con Meta, Mistral, Salesforce, Harvey AI y más. Únase a nosotros el 11 de diciembre en este evento virtual gratuito para aprender lo que se necesita para construir a lo grande con modelos pequeños de pioneros de la IA como Meta, Mistral AI, Salesforce, Harvey AI, Upstage, Nubank, Nvidia, Hugging Face y más.
Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como emprendedor e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.
🐝🐝 Evento de LinkedIn, ‘Una plataforma, posibilidades multimodales’, donde el director ejecutivo de Encord, Eric Landau, y el director de ingeniería de productos, Justin Sharps, hablarán sobre cómo están reinventando el proceso de desarrollo de datos para ayudar a los equipos a construir rápidamente modelos de IA multimodales innovadores.