SuperAnnotate quiere ayudar a las empresas a gestionar sus conjuntos de datos de IA
Los datos de alta calidad pueden ser la clave para una IA de alta calidad. Dado que los estudios han encontrado que la conservación de los conjuntos de datos, más que el tamaño, es lo que realmente afecta el rendimiento de un modelo de IA, no sorprende que haya un énfasis creciente en las prácticas de gestión de conjuntos de datos. Según algunas encuestas, los investigadores de IA hoy en día dedican gran parte de su tiempo a tareas de organización y preparación de datos.
Los hermanos Vahan Petrosyan y Tigran Petrosyan sintieron el dolor de tener que gestionar muchos datos mientras entrenaban algoritmos en la universidad. Vahan llegó incluso a crear una herramienta de gestión de datos durante su doctorado. Investigación sobre segmentación de imágenes.
Unos años más tarde, Vahan se dio cuenta de que los desarrolladores (e incluso las corporaciones) pagarían con gusto por herramientas similares. Entonces los hermanos fundaron una empresa, SuperAnnotate, para construirlo.
“Durante la explosión de innovación en 2023 en torno a los modelos y la IA multimodal, la necesidad de conjuntos de datos de alta calidad se volvió más estricta, y cada organización tenía múltiples casos de uso que requerían datos especializados”, dijo Vahan en un comunicado. “Vimos la oportunidad de crear una plataforma fácil de usar y con poco código, como una navaja suiza para datos de entrenamiento de IA modernos”.
SuperAnnotate, cuyos clientes incluyen Databricks y Canva, ayuda a los usuarios a crear y realizar un seguimiento de grandes conjuntos de datos de entrenamiento de IA. La startup se centró inicialmente en software de etiquetado, pero ahora ofrece herramientas para ajustar, iterar y evaluar conjuntos de datos.
Con la plataforma de SuperAnnotate, los usuarios pueden conectar datos de fuentes locales y la nube para crear proyectos de datos en los que pueden colaborar con sus compañeros de equipo. Desde un panel, los usuarios pueden comparar el rendimiento de los modelos según los datos que se utilizaron para entrenarlos y luego implementar esos modelos en varios entornos una vez que estén listos.
SuperAnnotate también brinda a las empresas acceso a un mercado de trabajadores colaborativos para tareas de anotación de datos. Las anotaciones suelen ser fragmentos de texto que etiquetan el significado o partes de los datos en los que se entrenan los modelos y sirven como guías para los modelos, “enseñándoles” a distinguir cosas, lugares e ideas.
Para ser sincero, hay varios hilos de Reddit sobre el tratamiento que hace SuperAnnotate a los anotadores de datos que utiliza, y no son halagadores. Los anotadores se quejan de problemas de comunicación, expectativas poco claras y bajos salarios.
Por su parte, SuperAnnotate afirma que paga tarifas justas de mercado y que sus exigencias a los anotadores no están fuera de la norma de la industria. Le hemos pedido a la empresa que proporcione información más detallada sobre sus prácticas y actualizaremos este artículo si recibimos una respuesta.
Hay varios competidores en el espacio de gestión de datos de IA, incluidas nuevas empresas como Scale AI, Weka y Dataloop. Sin embargo, SuperAnnotate, con sede en San Francisco, ha logrado mantenerse firme, recaudando recientemente 36 millones de dólares en una ronda de Serie B liderada por Socium Ventures, con la participación de Nvidia, Databricks Ventures, Play Time Ventures y Defy.vc.
El nuevo capital, que eleva el total recaudado por SuperAnnotate a poco más de 53 millones de dólares, se utilizará para aumentar su equipo actual de alrededor de 100 personas, para I+D de productos y para hacer crecer la base de clientes de SuperAnnotate de aproximadamente 100 empresas.
“Nuestro objetivo es construir una plataforma capaz de adaptarse completamente a las necesidades cambiantes de las empresas y ofrecer una amplia personalización en el ajuste de datos”, dijo Vahan.