Voyage AI presenta Voyage-3 y Voyage-3-Lite: una nueva generación de modelos integrados pequeños que supera a OpenAI v3 grande en un 7,55 %

Voyage AI se enorgullece de anunciar el lanzamiento de su nueva generación de modelos integrados, Viaje-3 y Viaje-3-Lite. Los modelos Voyage-3 y Voyage-3-Lite están diseñados para superar los estándares industriales existentes en diversos ámbitos, incluidos tecnología, derecho, finanzas, aplicaciones multilingües y comprensión de contextos prolongados. Según las evaluaciones de Voyage AI, Voyage-3 supera al modelo grande V3 de OpenAI en un promedio de 7,55 % en todos los dominios probados, que incluyen documentación técnica, código, derecho, finanzas, contenido web, conjuntos de datos multilingües, documentos extensos y datos conversacionales. Además, Voyage-3 logra esto con costos 2,2 veces más bajos y una dimensión de incrustación 3 veces más pequeña, lo que se traduce en costos de bases de datos vectoriales (vectorDB) significativamente reducidos. De manera similar, Voyage-3-Lite ofrece una precisión de recuperación un 3,82% mejor que el modelo grande V3 de OpenAI, con costos 6 veces más bajos y una dimensión de incrustación 6 veces más pequeña.

Rentabilidad sin comprometer la calidad

La rentabilidad es el núcleo de los nuevos modelos de la serie Voyage-3. Con una longitud de contexto de 32.000 tokens, cuatro veces más que la oferta de OpenAI, Voyage-3 es una solución rentable para empresas que requieren una recuperación de alta calidad sin tener que gastar mucho dinero. Por ejemplo, Voyage-3 cuesta 0,06 dólares por millón de tokens, lo que lo hace 1,6 veces más barato que Cohere English V3 y sustancialmente más asequible que el gran modelo V3 de OpenAI. Además, la dimensión de integración más pequeña de Voyage-3 (1024 frente a 3072 de OpenAI) da como resultado costos de vectorDB más bajos, lo que permite a las empresas escalar sus aplicaciones de manera eficiente.

Voyage-3-Lite, la variante más ligera del modelo, está optimizada para operaciones de baja latencia. A 0,02 dólares por millón de tokens, es 6,5 veces más barato que el modelo grande V3 de OpenAI y tiene una dimensión de incrustación entre 6 y 8 veces más pequeña (512 frente al 3072 de OpenAI). Esto convierte a Voyage-3-Lite en una opción viable para las organizaciones que buscan mantener una alta calidad de recuperación a una fracción del costo.

Versatilidad en múltiples dominios

El éxito de los modelos de la serie Voyage-3 se extiende más allá de las incrustaciones de uso general. Durante los últimos nueve meses, Voyage AI ha lanzado un conjunto de modelos integrados de la serie Voyage-2, incluidos modelos de dominio específico como Voyage-Large-2, Voyage-Code-2, Voyage-Law-2, Voyage-Finance-2. y Viaje-Multilingüe-2. Estos modelos se han entrenado exhaustivamente con datos de sus respectivos dominios, lo que demuestra un rendimiento excepcional en casos de uso especializados.

Por ejemplo, Voyage-Multilingual-2 ofrece una calidad de recuperación superior en francés, alemán, japonés, español y coreano, manteniendo al mismo tiempo el mejor rendimiento de su clase en inglés. Estos logros dan testimonio del compromiso de Voyage AI de desarrollar modelos sólidos adaptados a necesidades comerciales específicas.

Especificaciones técnicas e innovaciones

Varias innovaciones en investigación sustentan el desarrollo de Voyage-3 y Voyage-3-Lite. Los modelos presentan una arquitectura mejorada, aprovechando la destilación de modelos más grandes y el entrenamiento previo en más de 2 billones de tokens de alta calidad. Además, la alineación de los resultados de la recuperación se refina a través de la retroalimentación humana, lo que mejora aún más la precisión y relevancia de los modelos.

Las especificaciones técnicas clave de los modelos de la serie Voyage-3 incluyen:

Viaje-3:

Dimensiones: 1024
Longitud del contexto: 32.000 tokens
Costo: $0,06 por millón de tokens
Calidad de recuperación (NDCG@10): 76 (supera a OpenAI V3 grande en un 7,55%)

Viaje-3-Lite:

Dimensiones: 512
Longitud del contexto: 32.000 tokens
Costo: $0.02 por millón de tokens
Calidad de recuperación (NDCG@10): 72 (supera a OpenAI V3 grande en un 3,82%)

La capacidad de los modelos para manejar una longitud de contexto de 32.000 tokens, en comparación con los 8.000 tokens de OpenAI y los 512 tokens de Cohere, los hace adecuados para aplicaciones que requieren una comprensión y recuperación integral de documentos grandes, como manuales técnicos, artículos académicos y resúmenes de casos legales.

Aplicaciones y casos de uso

Los modelos de la serie Voyage-3 se adaptan a una amplia gama de industrias y permiten aplicaciones en dominios como:

Documentación técnica: Proporcionar recuperación precisa y contextual de grandes manuales técnicos y guías de programación.
Código: Ofrece una comprensión mejorada de los fragmentos de código, las cadenas de documentos y la lógica de programación, lo que lo hace ideal para el desarrollo de software y la revisión de códigos.
Ley: Apoyar investigaciones jurídicas complejas mediante la recuperación de opiniones judiciales, estatutos y argumentos legales relevantes.
Finanzas: Agilizar la recuperación de estados financieros, presentaciones ante la SEC e informes de análisis de mercado.
Aplicaciones multilingües: Facilitando la búsqueda y recuperación multilingüe en 26 idiomas, incluidos francés, alemán, japonés, español y coreano.

Recomendaciones para usuarios

Voyage AI recomienda que cualquier usuario de integración de propósito general actualice a Voyage-3 para obtener una calidad de recuperación mejorada a un bajo costo. Voyage-3-Lite ofrece un excelente equilibrio entre rendimiento y asequibilidad para quienes buscan mayores ahorros de costos. Los casos de uso de dominios específicos, como código, derecho y finanzas, aún pueden beneficiarse de los modelos de la serie Voyage-2 como Voyage-Code-2, Voyage-Law-2 y Voyage-Finance-2, aunque Voyage-3 proporciona altamente desempeño competitivo también en estas áreas.

Desarrollos futuros

El equipo de Voyage AI trabaja continuamente para ampliar las capacidades de los modelos de la serie Voyage-3. En las próximas semanas, se espera que el lanzamiento de Voyage-3-Large establezca un nuevo estándar para incorporaciones de propósito general a gran escala, solidificando aún más la posición de Voyage AI como líder en este campo. Para aquellos interesados en explorar el potencial de la serie Voyage-3, los primeros 200 millones de tokens se pueden probar gratis. Los usuarios pueden utilizar estos modelos inmediatamente especificando “voyage-3” o “voyage-3-lite” como parámetro del modelo en las llamadas a la API de Voyage. El lanzamiento de Voyage-3 y Voyage-3-Lite por parte de Voyage AI representa un gran paso adelante en la tecnología de integración, ofreciendo una combinación única de alto rendimiento, bajo costo y versatilidad. Con estos nuevos modelos, Voyage AI continúa liderando el camino en la creación de soluciones de última generación para empresas y desarrolladores de todo el mundo.

Mira el Modelos sobre la cara abrazada y detalles aquí. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro SubReddit de más de 50.000 ml

Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como empresario e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.