Marqo lanza modelos integrados avanzados de comercio electrónico y conjuntos de datos de evaluación integrales para revolucionar la búsqueda, recomendación y evaluación comparativa de productos para aplicaciones de inteligencia artificial minorista
Marqo ha introducido cuatro conjuntos de datos innovadores y modelos de integración de comercio electrónico de última generación diseñados para mejorar las capacidades de búsqueda, recuperación y recomendación de productos en el comercio electrónico. Estos modelos, Marqo-Ecommerce-B y Marqo-Ecommerce-L, ofrecen mejoras sustanciales en precisión y relevancia para las plataformas de comercio electrónico al ofrecer representaciones integradas de alta calidad de datos de productos. Además de estos modelos, Marqo ha publicado una serie de conjuntos de datos de evaluación, incluidos AmazonProducts-3m, GoogleShopping-1m, AmazonProducts-Eval-100k y GoogleShopping-General-Eval-100k, para proporcionar una base sólida para la evaluación comparativa y la comparación de modelos.
El recién introducido Marqo-Ecommerce-B y Marqo-Ecommerce-L La incorporación de modelos representa un avance significativo en los sistemas de búsqueda y recomendación de comercio electrónico. Marqo-Ecommerce-B, con 203 millones de parámetros, y Marqo-Ecommerce-L, con 652 millones de parámetros, están optimizados para capturar características complejas dentro de imágenes de productos y descripciones de texto. Estos modelos aprovechan una amplia capacitación sobre diversos datos de productos para facilitar comparaciones matizadas y mejorar la comprensión contextual de diversos atributos del producto.
Para ilustrar el rendimiento de estos modelos, Marqo empleó dos conjuntos de datos clave para la evaluación: AmazonProducts-3m y GoogleShopping-1m. Estos conjuntos de datos permiten a los usuarios probar y validar las capacidades de los modelos en muchos escenarios de comercio electrónico, simulando la diversidad y complejidad de una plataforma de comercio electrónico del mundo real.
Los resultados de la evaluación comparativa subrayan el impresionante rendimiento de los modelos de Marqo. Marqo-Ecommerce-L, el más grande de los dos modelos, demostró una mejora promedio del 17,6 % en el rango recíproco medio (MRR) y del 20,5 % en nDCG@10 en comparación con el mejor modelo de código abierto, ViT-SO400M-14-SigLIP. , en todas las tareas dentro del conjunto de datos Marqo-Ecommerce-Hard. En comparación con el modelo propietario de Amazon, Amazon-Titan-Multimodal, Marqo-Ecommerce-L logró una mejora aún más pronunciada: 38,9 % en MRR, 45,1 % en nDCG@10 y 35,9 % en Recall en las tareas de texto a imagen. . Estas métricas resaltan la competencia de Marqo-Ecommerce-L para clasificar con precisión productos relevantes y su desempeño superior en la comprensión de entradas textuales y visuales complejas.
Los cuatro conjuntos de datos publicados
Para respaldar la evaluación del modelo, Marqo ha publicado cuatro conjuntos de datos, cada uno de los cuales tiene un propósito único en la investigación y el desarrollo relacionados con el comercio electrónico:
- AmazonProducts-3m: este conjunto de datos a gran escala de tres millones de productos de Amazon está diseñado para la evaluación de modelos de alta calidad. Proporciona diversos datos de productos, incluidas imágenes y descripciones de texto, que desafían a los modelos a capturar con precisión los matices de las características del producto en diversas categorías.
- GoogleShopping-1m: este conjunto de datos comprende un millón de entradas de Google Shopping y proporciona una perspectiva alternativa al conjunto de datos de AmazonProducts, ofreciendo productos que pueden tener atributos o marcas distintos. Este conjunto de datos permite realizar pruebas exhaustivas de la adaptabilidad de un modelo a diversas plataformas de comercio electrónico y categorías de productos.
- AmazonProducts-Eval-100k: AmazonProducts-Eval-100k, una versión más compacta de AmazonProducts-3m, está diseñado para investigadores que pueden necesitar una muestra más pequeña para las pruebas iniciales o el refinamiento del modelo. Mantiene la diversidad de atributos de producto que se encuentran en AmazonProducts-3m, lo que permite evaluaciones rápidas pero exhaustivas del rendimiento de un modelo.
- GoogleShopping-General-Eval-100k: GoogleShopping-General-Eval-100k es una versión condensada de GoogleShopping-1m, que permite realizar evaluaciones comparativas eficientes con menos recursos computacionales. Este conjunto de datos brinda acceso a las características esenciales de los datos de Google Shopping, lo que lo hace ideal para evaluaciones rápidas y ajustes iterativos de modelos.
Los modelos de incrustación de Marqo están disponibles en Hugging Face, lo que permite a los desarrolladores cargarlos fácilmente para aplicaciones de comercio electrónico basadas en texto e imágenes. A través de la biblioteca Transformers de Hugging Face, los usuarios pueden integrar perfectamente los modelos de Marqo en sus aplicaciones. Por ejemplo, con un simple fragmento de código, los usuarios pueden cargar Marqo-Ecommerce-L o Marqo-Ecommerce-B usando las clases `AutoModel` y `AutoProcessor`. Luego, los modelos se pueden utilizar para procesar y analizar imágenes y texto de productos, lo que facilita a los usuarios la extracción de incrustaciones de alta calidad que facilitan la búsqueda y recomendación efectiva de productos.
Alternativamente, los modelos de Marqo se pueden cargar usando `open_clip` para los usuarios que trabajan con OpenCLIP. Este marco permite a los usuarios preprocesar imágenes de productos y tokenizar entradas de texto, optimizándolas para la arquitectura del modelo de Marqo. Los resultados producidos a través de OpenCLIP proporcionan probabilidades de etiquetas que indican qué tan relevante es una imagen o entrada de texto determinada para etiquetas de productos específicos, lo que ayuda a categorizar y recomendar productos con precisión.
Un componente central de la evaluación del modelo de Marqo es el aprendizaje contrastivo generalizado (GCL), una técnica que mejora la eficacia de la comparación de texto con imagen e imagen con texto. Al emplear GCL, Marqo garantiza que sus modelos identifiquen relaciones matizadas entre datos textuales y visuales. Esta capacidad es crucial para cualquier plataforma de comercio electrónico que proporcione recomendaciones confiables y sólidas funcionalidades de búsqueda de productos.
Marqo ha incluido los scripts de evaluación necesarios, lo que facilita a los desarrolladores replicar los resultados de la evaluación comparativa y experimentar con datos adicionales. Con GCL como metodología de evaluación central, los modelos de Marqo están optimizados para aplicaciones de comercio electrónico del mundo real que requieren incorporaciones altamente precisas en entradas de datos variadas y complejas.
El lanzamiento de Marqo de estos modelos y conjuntos de datos presenta múltiples aplicaciones prácticas para investigadores y empresas de comercio electrónico. Los minoristas pueden aprovechar los modelos de Marqo para implementar recomendaciones precisas de productos, facilitar búsquedas de productos más rápidas y precisas y mejorar la satisfacción del cliente al mejorar la relevancia de sus plataformas. Los investigadores también pueden beneficiarse de la amplitud y diversidad de los conjuntos de datos, utilizándolos como puntos de referencia para comparar sus modelos o ampliar aún más los límites de los sistemas de recomendación de comercio electrónico.
En conclusión, los nuevos modelos integrados y conjuntos de datos de Marqo marcan un hito importante en la evolución de la IA del comercio electrónico. Al ofrecer modelos sólidos y de alto rendimiento y conjuntos de datos cuidadosamente seleccionados, Marqo proporciona a las empresas de comercio electrónico y a la comunidad de investigación herramientas invaluables para impulsar la búsqueda de productos y la innovación en las recomendaciones. Estos recursos subrayan la creciente importancia de la IA en la transformación del comercio electrónico y establecen un nuevo punto de referencia sobre lo que pueden lograr los modelos de IA en este sector.
Mira el Modelos y conjuntos de datos aquí. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.
(SEMINARIO WEB GRATUITO sobre IA) Implementación del procesamiento inteligente de documentos con GenAI en servicios financieros y transacciones inmobiliarias– Del marco a la producción
Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como empresario e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.
🐝🐝 Evento de LinkedIn, ‘Una plataforma, posibilidades multimodales’, donde el director ejecutivo de Encord, Eric Landau, y el director de ingeniería de productos, Justin Sharps, hablarán sobre cómo están reinventando el proceso de desarrollo de datos para ayudar a los equipos a construir rápidamente modelos de IA multimodales innovadores.