Profundización de Ready Tensor en la clasificación de pasos de series temporales: análisis comparativo de 25 modelos de redes neuronales y aprendizaje automático

El análisis de series de tiempo es un dominio complejo y desafiante en la ciencia de datos, principalmente debido a la naturaleza secuencial y las dependencias temporales inherentes a los datos. La clasificación de pasos en este contexto implica asignar etiquetas de clase a pasos de tiempo individuales, lo cual es crucial para comprender patrones y hacer predicciones. Ready Tensor realizó un extenso estudio comparativo para evaluar el rendimiento de 25 modelos de aprendizaje automático en cinco conjuntos de datos distintos para mejorar la precisión de la clasificación de pasos de series temporales en su última publicación sobre evaluación comparativa de clasificación de pasos de tiempo.

El estudio evaluó cada modelo utilizando cuatro métricas de evaluación principales: exactitud, precisión, recuperación y puntuación F1, a través de varias series de datos de tiempo. El análisis exhaustivo destacó variaciones significativas en el rendimiento del modelo, mostrando las fortalezas y limitaciones de los diferentes enfoques de modelado. Los resultados indican que elegir el modelo correcto en función de las características del conjunto de datos y la tarea de clasificación es fundamental para lograr un alto rendimiento. Esta publicación proporciona un recurso valioso para seleccionar modelos y contribuye al discurso actual sobre los avances metodológicos en el análisis de series de tiempo.

Descripción general de los conjuntos de datos

El estudio de evaluación comparativa utilizó cinco conjuntos de datos distintos elegidos para representar un conjunto diverso de tareas de clasificación de series temporales. Los conjuntos de datos incluían datos sintéticos y del mundo real, que cubrían varias frecuencias temporales y duraciones de series. Los conjuntos de datos se describen brevemente de la siguiente manera:

HAR70Plus: Un conjunto de datos derivado del conjunto de datos de Reconocimiento de actividad humana (HAR), que consta de 18 series con siete clases y seis características. La longitud mínima de la serie es 871 y la máxima es 1536.
HMM Continuo: Un conjunto de datos sintético que comprende 500 series con cuatro clases y tres características, que van de 50 a 300 pasos de tiempo.
Sinusoidal multifrecuencia: Otro conjunto de datos sintéticos con 100 series, cinco clases y dos características, con una longitud de serie que oscila entre 109 y 499 pasos de tiempo.
Detección de ocupación: Un conjunto de datos del mundo real con solo una serie, dos clases y cinco características, que consta de 20.560 pasos de tiempo.
PAMAP2: Un conjunto de datos de actividad humana que contiene nueve series, 12 clases y 31 características, con una longitud de serie que oscila entre 64 y 2725.

Los conjuntos de datos, incluidos HAR70 y PAMAP2, son versiones agregadas obtenidas del repositorio de aprendizaje automático de UCI. Los datos se agregaron por medias para crear conjuntos de datos con menos pasos de tiempo, lo que los hace adecuados para el estudio.

Modelos evaluados

El estudio comparativo de Ready Tensor clasificó los 25 modelos evaluados en tres tipos principales: modelos de aprendizaje automático (ML), modelos de redes neuronales y una categoría especial llamada modelo de perfil de distancia.

Modelos de aprendizaje automático: Este grupo incluye 17 modelos seleccionados por su capacidad para manejar dependencias secuenciales dentro de datos de series de tiempo. Ejemplos de modelos en esta categoría son Random Forest, K-Nearest Neighbors (KNN) y Regresión logística.
Modelos de redes neuronales: Esta categoría comprende siete modelos y presenta arquitecturas de redes neuronales avanzadas expertas en capturar patrones intrincados y dependencias de largo alcance en datos de series temporales. Los modelos destacados incluyen la memoria a largo y corto plazo (LSTM) y las redes neuronales convolucionales (CNN).
Modelo de perfil de distancia: Este modelo, mencionado en el estudio, emplea un enfoque único basado en calcular distancias entre puntos de datos de series temporales. Se distingue de los métodos tradicionales de aprendizaje automático y redes neuronales y proporciona una perspectiva diferente sobre la clasificación de series temporales.

Resultados y conocimientos

El estudio evaluó cada modelo individualmente en todos los conjuntos de datos, promediando las métricas de rendimiento para obtener una puntuación general. Los datos consolidados se presentaron en un mapa de calor, con los modelos enumerados en el eje y y las métricas, exactitud, precisión, recuperación y puntuación F1, en el eje x. Los valores representaron el promedio de cada métrica en todos los conjuntos de datos, lo que proporciona una comparación visual clara del rendimiento del modelo.

Mejores artistas: Los resultados mostraron que los algoritmos de refuerzo y los métodos de conjunto avanzados funcionaron excepcionalmente bien. CatBoost logró una puntuación F1 de 0,80, seguido de LightGBM con 0,78, Hist Gradient Boosting con 0,77 y XGBoost y Stacking con 0,77. Estos modelos se destacaron en la gestión de funciones complejas y el manejo de conjuntos de datos desequilibrados.
Fuertes contendientes: Modelos como Gradient Boosting y Extra Trees obtuvieron una puntuación de 0,75, mientras que Random Forest obtuvo un sólido rendimiento de 0,75. Estos modelos demostraron ser opciones confiables, particularmente en escenarios donde los de mejor desempeño podrían ser computacionalmente costosos o propensos a un sobreajuste.
Ejecutores de referencia o promedio: Modelos como Bagging y SVC obtuvieron una puntuación de 0,74, junto con modelos de redes neuronales como CNN, RNN y LSTM con 0,73. Estos modelos proporcionaron un rendimiento razonable y podrían servir como puntos de referencia para la comparación.
Por debajo del promedio Artistas: Modelos como la regresión logística (0,66), Ridge (0,64) y árbol de decisión (0,63) tuvieron dificultades para capturar dependencias temporales complejas. KNN y AdaBoost obtuvieron puntuaciones en el extremo inferior del espectro, con puntuaciones F1 de 0,61 y 0,60, respectivamente.

Conclusión

El estudio de evaluación comparativa de Ready Tensor ofrece una evaluación detallada de 25 modelos en cinco conjuntos de datos para la clasificación de pasos de series temporales. Los resultados subrayan la eficacia de impulsar algoritmos como CatBoost, LightGBM y XGBoost en la gestión de datos de series temporales. La visualización del mapa de calor del estudio proporcionó una comparación integral, destacando las fortalezas y debilidades de varios enfoques de modelado. Esta publicación sirve como una guía valiosa para investigadores y profesionales, ayudando a seleccionar modelos apropiados para tareas de clasificación de pasos de series temporales y contribuyendo al desarrollo de soluciones más efectivas y eficientes en este campo en evolución.

Mira el Detalles. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro SubReddit de más de 50.000 ml

¿Está interesado en promocionar su empresa, producto, servicio o evento ante más de 1 millón de desarrolladores e investigadores de IA? ¡Colaboremos!

Aswin AK es pasante de consultoría en MarkTechPost. Está cursando su doble titulación en el Instituto Indio de Tecnología de Kharagpur. Le apasiona la ciencia de datos y el aprendizaje automático, y aporta una sólida formación académica y experiencia práctica en la resolución de desafíos interdisciplinarios de la vida real.