Los investigadores de Google AI presentan un nuevo modelo de bioacústica de ballenas que puede identificar ocho especies distintas, incluidos múltiples cantos para dos de esas especies

Las especies de ballenas producen una amplia gama de vocalizaciones, desde frecuencias muy bajas hasta frecuencias muy altas, que varían según la especie y la ubicación, lo que dificulta el desarrollo de modelos que clasifiquen automáticamente varias especies de ballenas. Al analizar las vocalizaciones de las ballenas, los investigadores pueden estimar el tamaño de las poblaciones, rastrear los cambios a lo largo del tiempo y ayudar a desarrollar estrategias de conservación, incluida la designación de áreas protegidas y medidas de mitigación. Un monitoreo efectivo es esencial para la conservación, pero la complejidad de los llamados de las ballenas, especialmente de las especies esquivas, y la gran cantidad de datos de audio submarinos complican los esfuerzos para rastrear sus poblaciones.

Los métodos actuales para la identificación de especies animales a través del sonido son más avanzados para las aves que para las ballenas, ya que modelos como Google Perch pueden clasificar miles de vocalizaciones de aves. Sin embargo, es más difícil desarrollar modelos de clasificación multiespecie similares para las ballenas debido a la diversidad de vocalizaciones de las ballenas y a la falta de datos exhaustivos para ciertas especies. Los esfuerzos anteriores se han centrado en especies específicas como las ballenas jorobadas, con modelos anteriores desarrollados por Google Research en asociación con la NOAA y otras organizaciones. Estos modelos ayudaron a clasificar los llamados de las ballenas jorobadas e identificaron nuevas ubicaciones de actividad de las ballenas.

Para abordar las limitaciones de los modelos anteriores, los investigadores de Google desarrollaron un nuevo modelo de bioacústica de ballenas capaz de clasificar las vocalizaciones de ocho especies distintas, incluido el misterioso sonido “Biotwang” atribuido a la ballena de Bryde. Este nuevo modelo amplía los esfuerzos anteriores al clasificar múltiples especies y tipos de vocalización, diseñado para su aplicación a gran escala en grabaciones acústicas pasivas a largo plazo.

El modelo de bioacústica de ballenas propuesto procesa los datos de audio convirtiéndolos en imágenes de espectrogramas para cada ventana de sonido de 5 segundos. La parte frontal del modelo utiliza ejes de frecuencia a escala mel y compresión de amplitud logarítmica. Luego clasifica estos espectrogramas en una de 12 clases, correspondientes a ocho especies de ballenas y varios tipos específicos de vocalización. Para garantizar clasificaciones precisas y minimizar los falsos positivos, el modelo se entrenó no solo con ejemplos positivos, sino también con datos de ruido de fondo y negativos. El rendimiento del modelo, medido mediante métricas como el área bajo la curva característica operativa del receptor (AUC), mostró fuertes capacidades discriminativas, en particular para especies como las ballenas Minke y Bryde.

Además de la tarea de clasificación, el modelo ayudó a los investigadores a descubrir nuevos conocimientos sobre los movimientos de las especies, incluidas las diferencias entre las poblaciones de ballenas de Bryde del Pacífico central y occidental. Al etiquetar más de 200.000 horas de grabaciones submarinas, el modelo también descubrió los patrones de migración estacional de algunas especies. El modelo ahora está disponible públicamente a través de Kaggle para su uso posterior en los esfuerzos de conservación e investigación de las ballenas.

En conclusión, el nuevo modelo de bioacústica de ballenas de Google es un avance significativo en el campo, ya que aborda el desafío de la clasificación de múltiples especies con un modelo que no solo reconoce ocho especies, sino que también brinda información detallada sobre su ecología. Este modelo es una herramienta crucial en la investigación de biología marina, ya que ofrece una clasificación escalable y precisa de datos de audio submarinos y mejora nuestra comprensión de las poblaciones de ballenas, especialmente de especies esquivas como las ballenas de Bryde.

Echa un vistazo a la Papel y BlogTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit con más de 50 000 millones de usuarios

⏩ ⏩ SEMINARIO WEB GRATUITO SOBRE IA: ‘SAM 2 para video: cómo optimizar sus datos’ (miércoles 25 de septiembre, 4:00 a. m. a 4:45 a. m. EST)

Pragati Jhunjhunwala es pasante de consultoría en MarktechPost. Actualmente está cursando su licenciatura en tecnología en el Instituto Indio de Tecnología (IIT) de Kharagpur. Es una entusiasta de la tecnología y tiene un gran interés en el ámbito de las aplicaciones de software y ciencia de datos. Siempre está leyendo sobre los avances en diferentes campos de la IA y el ML.

⏩ ⏩ SEMINARIO WEB GRATUITO SOBRE IA: ‘SAM 2 para video: cómo optimizar sus datos’ (miércoles 25 de septiembre, 4:00 a. m. a 4:45 a. m. EST)