Recuperación contextual: una técnica avanzada de inteligencia artificial que reduce las tasas de recuperación de fragmentos incorrectos hasta en un 67 %

El desarrollo de modelos de inteligencia artificial (IA), especialmente en contextos especializados, depende de su capacidad para acceder y utilizar información previa. Por ejemplo, las herramientas de IA jurídicas deben conocer bien una amplia gama de casos anteriores, mientras que los chatbots de atención al cliente requieren información específica sobre las empresas a las que prestan servicios. La metodología de recuperación y generación aumentada (RAG) es un método que los desarrolladores utilizan con frecuencia para mejorar el rendimiento de un modelo de IA en varias áreas.

Al obtener información pertinente de una base de conocimientos e integrarla en las indicaciones del usuario, la RAG mejora enormemente el rendimiento de una IA. Sin embargo, una desventaja importante de los enfoques RAG tradicionales es que a menudo pierden el contexto durante el proceso de codificación, lo que dificulta la extracción de la información más pertinente.

La dependencia de RAG de segmentar los materiales en fragmentos más pequeños y fáciles de gestionar para su recuperación puede provocar involuntariamente la pérdida de contexto importante. Por ejemplo, un usuario puede consultar el crecimiento de las ventas de una empresa en particular durante un trimestre determinado utilizando una base de conocimientos financieros. Un sistema RAG convencional podría recuperar una sección de texto que diga: “Los ingresos de la empresa crecieron un 3 % con respecto al trimestre anterior”. Pero sin ningún contexto, este extracto no indica qué empresa o trimestre se está analizando, lo que hace que la información recuperada sea menos útil.

Para superar este problema se ha desarrollado una nueva técnica conocida como Recuperación contextual Anthropic AI introdujo una técnica que aumenta significativamente la precisión de recuperación de información de los sistemas RAG. Las dos subtécnicas que respaldan este enfoque son las incrustaciones contextuales y la BM25 contextual. La recuperación contextual puede reducir la tasa de recuperaciones de información fallidas en un 49 % y, cuando se combina con la reclasificación, en un asombroso 67 %, al mejorar la forma en que se procesan y almacenan los segmentos de texto. Estas mejoras se transfieren directamente a una mayor eficiencia en tareas posteriores, lo que aumenta la eficacia y la confiabilidad de los modelos de IA.

Para que Recuperación contextual Para que funcione, cada segmento de texto debe tener primero un contexto explicativo específico del fragmento agregado antes de que pueda ser incrustado o se pueda construir el índice BM25. Un extracto que diga, por ejemplo, “Los ingresos de la empresa crecieron un 3% con respecto al trimestre anterior”, podría cambiarse para decir, “Este extracto es de una presentación ante la SEC sobre el desempeño de ACME Corp en el segundo trimestre de 2023; los ingresos del trimestre anterior fueron de $314 millones”. Los ingresos de la empresa aumentaron un 3% con respecto al trimestre anterior”. Al sistema le resulta mucho más fácil recuperar y aplicar la información correcta con este contexto adicional.

Los desarrolladores pueden usar asistentes de IA como Claude para lograr la recuperación contextual en enormes bibliotecas de conocimiento. Pueden crear anotaciones breves y específicas del contexto para cada fragmento dándole a Claude instrucciones precisas. Estas anotaciones luego se agregan al texto antes de incrustarlo e indexarlo.

Los modelos de incrustación se utilizan en RAG convencional para capturar asociaciones semánticas entre segmentos de texto. Estos modelos pueden pasar por alto coincidencias exactas importantes en ocasiones, en particular al manejar consultas, incluidos identificadores únicos o frases técnicas. Aquí es donde la función de clasificación basada en coincidencia léxica BM25 resulta útil. Debido a sus excepcionales capacidades de coincidencia de palabras o frases, BM25 es especialmente útil para consultas técnicas que requieren una recuperación de información correcta. Los sistemas RAG pueden recuperar mejor la información más pertinente al integrar la incrustación contextual con BM25, logrando un equilibrio entre la coincidencia exacta de términos y una comprensión semántica más amplia.

Un método más sencillo podría funcionar para bases de conocimiento más pequeñas, donde todo el conjunto de datos puede caber en la ventana de contexto del modelo de IA. Sin embargo, las bases de conocimiento más grandes requieren el uso de técnicas más avanzadas, como la recuperación contextual. Este método permite trabajar con bases de conocimiento sustancialmente más grandes de las que podrían caber en una sola solicitud, no solo porque se adapta con éxito a conjuntos de datos más grandes, sino también porque mejora significativamente la precisión de la recuperación.

Se puede agregar una fase de reclasificación para mejorar aún más el rendimiento de la recuperación contextual. La reclasificación es el proceso de filtrar y priorizar fragmentos potencialmente relevantes que se han recuperado primero según su relevancia e importancia para la consulta del usuario. Al garantizar que el modelo de IA reciba solo los datos más relevantes, esta fase mejora los tiempos de respuesta y reduce los gastos. En las pruebas, la tasa de fallas de recuperación de los 20 fragmentos principales se redujo en un 67 % cuando se combinaron la recuperación contextual y la reclasificación.

En conclusión, la recuperación contextual es una mejora importante en la eficiencia de los modelos de IA, especialmente en circunstancias específicas en las que se necesita una recuperación de información precisa y exacta. La combinación de BM25 contextual, incrustaciones contextuales y reclasificación puede generar mejoras significativas en la precisión de la recuperación y el rendimiento general de la IA.


Tanya Malhotra es una estudiante de último año de la Universidad de Estudios de Petróleo y Energía, Dehradun, que cursa BTech en Ingeniería Informática con una especialización en Inteligencia Artificial y Aprendizaje Automático.
Es una entusiasta de la ciencia de datos con un buen pensamiento analítico y crítico, junto con un gran interés en adquirir nuevas habilidades, liderar grupos y gestionar el trabajo de manera organizada.

⏩ ⏩ SEMINARIO WEB GRATUITO SOBRE IA: ‘SAM 2 para video: cómo optimizar sus datos’ (miércoles 25 de septiembre, 4:00 a. m. a 4:45 a. m. EST)

Leer más
Back to top button