CoAgentes de CopilotKit: el eslabón perdido que facilita la conexión de los agentes LangGraph con los humanos en el circuito
CopilotoKit ha surgido como un marco líder de código abierto diseñado para optimizar la integración de la IA en aplicaciones modernas. Ampliamente apreciado dentro de la comunidad de código abierto, CopilotKit ha obtenido un reconocimiento significativo, con más de Más de 10,5 mil estrellas de GitHub. La plataforma permite a los desarrolladores crear copilotos de IA personalizados, agentes en la aplicación y asistentes interactivos capaces de interactuar dinámicamente con el entorno de su aplicación. Creado teniendo en cuenta la complejidad de las integraciones modernas de IA, CopilotKit maneja aspectos complejos como el conocimiento del contexto de la aplicación, la interacción en tiempo real y el manejo de datos.
Con la introducción del nuevo Lanzamiento beta de CoAgentsCopilotKit amplía su funcionalidad para admitir agentes de IA Human-in-the-Loop (HITL) más sofisticados. Estos agentes se desarrollan junto con LangGraph, un marco avanzado que mejora la colaboración entre agentes de IA y operadores humanos, lo que permite un rendimiento del sistema más confiable y autónomo. Profundicemos en las características y componentes clave de CopilotKit y en cómo el lanzamiento de CoAgents es fundamental para crear sistemas de IA centrados en el ser humano.
¿Qué es CopilotKit?
CopilotKit sirve como un marco de infraestructura sólido, lo que facilita la incorporación de funciones impulsadas por IA, como chatbots, agentes en la aplicación y herramientas inteligentes de generación de texto dentro de las aplicaciones. La plataforma ofrece varios componentes nativos, lo que permite a los desarrolladores crear funciones de IA compatibles con aplicaciones sin problemas. Los componentes clave incluyen:
- CopilotoChat: Una herramienta que permite a los desarrolladores crear chatbots de IA con soporte nativo para LangChain, LangGraph y otros marcos, lo que permite a los chatbots interactuar tanto con el frontend como con el backend de las aplicaciones.
- Área de texto del copiloto: Este componente, que reemplaza el elemento estándar ‘
- Agentes en la aplicación: Estos agentes tienen acceso en tiempo real a los contextos de las aplicaciones y pueden iniciar acciones basadas en las interacciones del usuario, creando un entorno dinámico y receptivo para los usuarios finales.
- Coagentes: Un marco para desarrollar agentes Human-in-the-Loop que respalden las intervenciones humanas, el intercambio de estados en tiempo real y el intercambio de datos estructurados, proporcionando una manera transparente de construir sistemas inteligentes que puedan funcionar de forma independiente pero que también acepten la guía de operadores humanos.
Desafíos abordados por CopilotKit
En la integración de la IA, los desarrolladores suelen necesitar más conocimiento del contexto, mejor calidad de interacción y requisitos de integración complejos. CopilotKit aborda estos problemas a través de su marco integral, que se integra profundamente con el frontend y backend de las aplicaciones. Al utilizar LangGraph, CopilotKit facilita el desarrollo de agentes de IA en la aplicación que pueden realizar tareas de forma autónoma o bajo supervisión humana. Algunos de los principales desafíos abordados incluyen:
- Conciencia del contexto: CopilotKit brinda a los agentes acceso en tiempo real al entorno de la aplicación, lo que garantiza que tengan el contexto para tomar decisiones informadas.
- Intervenciones humanas en el circuito: Con CoAgents, los operadores humanos ahora pueden monitorear e intervenir en las actividades de los agentes, evitando acciones erróneas y garantizando que los agentes mantengan el rumbo.
Lanzamiento Beta de CoAgents: Transformando la colaboración entre humanos e IA
La versión beta de CoAgents representa una mejora significativa de las capacidades de CopilotKit. Basado en LangGraph, CoAgents permite a los desarrolladores crear sistemas HITL AI que cierran la brecha entre agentes totalmente autónomos y la supervisión humana. Este enfoque híbrido permite a los agentes realizar tareas complejas mientras son guiados por aportaciones humanas cuando es necesario. Las características clave de CoAgents incluyen:
- Estados del agente intermedio de streaming: Con esta característica, los CoAgents pueden transmitir sus estados intermedios a la interfaz de usuario de la aplicación, brindando a los usuarios visibilidad de lo que está haciendo el agente en tiempo real. Esta transparencia garantiza que los usuarios puedan validar los pasos del agente y ofrecer aportaciones correctivas según sea necesario.
- Estado compartido entre agentes y aplicaciones: Los CoAgents facilitan el intercambio de estado bidireccional entre la aplicación y el agente, lo que permite la colaboración y la sincronización de datos en tiempo real.
- Preguntas y respuestas del agente: Esta función permite a los agentes hacer preguntas a los usuarios cuando se requiere información adicional para completar una tarea. Las interacciones de preguntas y respuestas se pueden formatear como texto o comentarios JSON según el contexto de la aplicación.
- Dirección del agente (próximamente): Pronto, CoAgents permitirá a los usuarios dirigir a los agentes a un estado anterior si se desvían del camino deseado. Esta característica facilitará la corrección de errores y la repetición de procesos desde puntos de control específicos.
Casos de uso del mundo real para CopilotKit y sus coagentes
CopilotKit y sus CoAgentes se han integrado en varias aplicaciones innovadoras, ampliando los límites de lo que los sistemas de IA pueden lograr. Algunos ejemplos notables incluyen:
- Aplicación de texto a PowerPoint: CopilotKit se ha utilizado para crear un generador de PowerPoint con tecnología de inteligencia artificial que puede buscar contenido en la web y crear diapositivas profesionales sobre cualquier tema. Esta aplicación utiliza Next.js, OpenAI, LangChain y Tavily, lo que demuestra la versatilidad de CopilotKit en el manejo de diferentes fuentes de datos y API.
- Plataforma de blogs impulsada por IA: Se creó una plataforma de blogs basada en inteligencia artificial utilizando CopilotKit. Puede investigar temas y redactar artículos basándose en las indicaciones de los usuarios. La plataforma se integra perfectamente con OpenAI y LangChain, lo que muestra cómo CopilotKit puede automatizar flujos de trabajo complejos en la creación de contenido.
- Creador de currículums de IA: Al combinar Next.js, CopilotKit y OpenAI, los desarrolladores han creado un creador de currículums interactivo que puede actualizar dinámicamente el contenido del currículum en función de las entradas del usuario y proporcionar sugerencias generadas por IA.
- Generador de libros de cuentos AI Coagent: Se utilizaron coagentes para construir un libro de cuentos para niños en una demostración. El agente de IA ayuda a desarrollar un esquema de historia, generar personajes, crear capítulos y proporcionar descripciones de imágenes. Esta aplicación utiliza DALL-E 3 para la generación de imágenes, lo que ofrece una forma atractiva de crear libros de cuentos interactivos.
Capacidades técnicas e integración
En esencia, CopilotKit está diseñado para funcionar a la perfección con LangGraph, un marco para definir, coordinar y ejecutar agentes LLM de manera estructurada utilizando gráficos. La integración de CopilotKit con LangGraph permite a los desarrolladores crear flujos de trabajo más sofisticados incorporando agentes de IA y aportaciones humanas. Las siguientes características hacen de CopilotKit una opción atractiva para la integración de IA:
- Diseño de marco primero: CopilotKit es una solución innovadora en el marco que conecta fácilmente cada componente de la aplicación al motor copiloto de IA.
- IU generativa: La plataforma admite la creación de interfaces de usuario interactivas y personalizadas representadas dentro del chat o junto con acciones iniciadas por IA. Esta característica mejora la experiencia del usuario y garantiza una interacción perfecta con los agentes de IA.
- Servicios en la nube llave en mano: CopilotKit proporciona servicios en la nube integrados para escalar copilotos, memoria de copiloto, historiales de chat y barreras de seguridad. Esto garantiza que los copilotos se vuelvan más inteligentes con cada interacción y puedan manejar implementaciones a gran escala.
- Chatbot de IA en la aplicación: CopilotKit ofrece componentes plug-and-play para agregar chatbots de IA a las aplicaciones, incluida la compatibilidad con elementos de interfaz de usuario sin cabeza.
El futuro de la IA: coagentes y sinergia entre humanos y IA
A medida que evoluciona el panorama de la IA, el papel de los sistemas de IA Human-in-the-Loop se vuelve cada vez más prominente. Si bien los agentes de IA totalmente autónomos todavía están lejos, los sistemas híbridos como los CoAgents ofrecen un enfoque equilibrado, aprovechando las capacidades de la IA y la guía de los operadores humanos. Esta sinergia es crucial para construir sistemas de IA que no sólo sean capaces sino también fiables y dignos de confianza.
A través de su enfoque de código abierto, CopilotKit invita a desarrolladores, nuevas empresas e instituciones de investigación a colaborar para mejorar las capacidades de los sistemas HITL. La introducción de CoAgents fortalece la posición de CopilotKit como plataforma líder en integración de IA. Establece un nuevo estándar para la creación de sistemas de IA confiables y centrados en el ser humano que puedan operar de manera efectiva en escenarios del mundo real.
Conclusión
CopilotKit y su marco CoAgents recientemente presentado ofrecen una solución integral para integrar fácilmente la IA en las aplicaciones. CopilotKit permite a los desarrolladores crear funciones de IA más sofisticadas que se adaptan a entornos y flujos de trabajo complejos centrándose en la colaboración entre humanos y IA. El soporte de la plataforma para el acceso al contexto en tiempo real, la transmisión de estados de los agentes y las capacidades de intervención humana la convierten en una opción convincente para quienes buscan crear agentes de IA inteligentes y con capacidad de respuesta. CopilotKit y CoAgents están preparados para desempeñar un papel fundamental en la configuración del futuro de los sistemas de IA HITL, acercando a los usuarios a lograr una fusión perfecta de la inteligencia humana y mecánica.
Mira el Repositorio de GitHub, documentación de CopilotKit, y Documentación de coagentes. Todo el crédito por esta investigación va a los investigadores de este proyecto.
Gracias al equipo de Tawkit por el liderazgo intelectual y los recursos para este artículo. Tawkit ha apoyado este contenido/artículo.
Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como empresario e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.