La ‘tienda de todo’ de Converge Bio para LLM en biotecnología genera semillas de 5,5 millones de dólares

La IA está llegando a todos los rincones de la investigación biotecnológica y farmacéutica, pero al igual que otras industrias, su implementación nunca es tan sencilla como nos gustaría. Converge Bio ha creado una herramienta para que las empresas hagan que sus LLM centrados en biología realmente funcionen, desde “enriquecer” sus datos hasta explicar sus respuestas. La compañía ha recaudado 5,5 millones de dólares en una ronda inicial para escalar su producto.

“Un modelo es sólo un modelo. No es suficiente”, afirmó el director ejecutivo y cofundador Dov Gertz. “Es necesario crear un canal para que las empresas puedan utilizar el modelo en su propio proceso de I+D. El mercado está muy fragmentado, pero la farmacéutica y la biotecnológica quieren consumir esta tecnología de forma consolidada, en un solo lugar. Queremos ser ese lugar”.

Si no es un ingeniero de aprendizaje automático que trabaja en el descubrimiento de fármacos, es posible que este no le resulte un problema familiar. Pero, básicamente, existen poderosos modelos fundacionales, grandes modelos de lenguaje entrenados no en libros e Internet, sino en enormes bases de datos de ADN, estructuras de proteínas y genómica.

Estos son modelos potentes y versátiles, pero al igual que los LLM utilizados en productos como ChatGPT y Cursor, requieren mucho trabajo para darles una forma que las personas realmente puedan usar en el día a día. Ese trabajo es especialmente difícil en dominios especializados como la microbiología o la inmunología. Tomar un LLM “en bruto” capacitado en miles de millones de secuencias de proteínas y convertirlo en algo que un técnico de laboratorio pueda usar como parte de su investigación normal no es un problema trivial.

Como ejemplo, Gertz sugirió la investigación con anticuerpos. Existe un LLM capacitado en biología específica de anticuerpos, pero es muy general. Converge Bio ofrece una serie de mejoras que se pueden realizar de forma segura y utilizando la IP propia de una empresa.

De izquierda a derecha: Iddo Weiner, director científico de Converge Bio; Dov Gertz, director ejecutivo; Oded Kalev, director de tecnología. Créditos de imagen:Omer Hacohen / Converge Bio

El primero es el “enriquecimiento de datos”, aumentando el LLM de anticuerpos con datos relacionados importantes, como las interacciones antígeno-anticuerpo y proteína-proteína. Luego, cargado con conocimientos más específicos, se puede ajustar al antígeno específico al que el equipo busca apuntar, y sobre el cual pueden tener datos patentados en el plato.

“Ahora tenemos una aplicación: la entrada es una secuencia, la salida es una afinidad vinculante”, dijo Gertz. Luego, la plataforma proporciona otra capa importante: la explicabilidad. Los investigadores pueden profundizar en el resultado para descubrir no sólo que “esta secuencia funciona mejor que esta”, sino también localizar hasta el nivel de aminoácido o par de bases qué parte de la secuencia parece ser haciendo Funciona mejor.

Por último, genera nuevas secuencias que proporcionan mejores resultados, además de explicables. Gertz señaló que la explicabilidad los ha sorprendido por su popularidad entre los clientes; tiene sentido, ya que permite a los expertos aplicar su experiencia en el campo (por ejemplo, interacciones de proteínas) a esta región más nueva y oscura de la bioinformática y el aprendizaje automático.

Créditos de imagen:Biografía convergente

Converge utiliza muchos modelos de base gratuitos y de código abierto que existen, pero también está trabajando para crear los suyos propios. Ya cuenta con un proceso patentado, dijo Gertz, para la parte de explicabilidad. Y el “plan de estudios” de enriquecimiento de datos también es enteramente suyo: no es un proceso trivial. Las metodologías de formación, señaló, son uno de los pocos secretos celosamente guardados por las empresas de IA más exitosas.

Eso es parte del foso que esperan construir, junto con el hecho de que. Como dijo Gertz: “Esta es probablemente la mayor oportunidad en biotecnología en cinco décadas”.

Sin embargo, muchas, quizás la mayoría, de las empresas de biotecnología no tienen una solución dedicada para realizar trabajos relacionados con el LLM en su campo y buscar activamente nichos a los que no se aplican las soluciones generalistas.

“La idea es ser el almacén de todo para la genAI en biotecnología y luego utilizarlo como cuña para ofrecer más con el tiempo”, dijo Gertz. “El comportamiento en el sector farmacéutico y biológico es que, una vez que tienen vínculos con un proveedor en el que confían, quieren usarlos en otros casos de uso, ya sea diseño de anticuerpos o diseño de vacunas. Por eso creo que este posicionamiento es el mejor para este momento del mercado”.

Los inversores parecen estar de acuerdo y pusieron 5,5 millones de dólares en una ronda inicial liderada por socios de TLV.

La empresa utilizará el dinero para contratar y adquirir clientes, como suelen hacer las nuevas empresas en esta etapa, pero también publicará un artículo científico sobre el diseño de anticuerpos (utilizando sus propios sistemas, por supuesto) y entrenará “un modelo básico adecuado”. “

Leer más
Back to top button