CRoP: un método de personalización estática según el contexto para modelos de IA con detección humana robustos y escalables en escenarios sanitarios y del mundo real

Las aplicaciones de detección humana, como el reconocimiento de actividades, la detección de caídas y el monitoreo de la salud, se han visto revolucionadas por los avances en la inteligencia artificial (IA) y las tecnologías de aprendizaje automático. Estas aplicaciones pueden tener un impacto significativo en la gestión de la salud al monitorear el comportamiento humano y proporcionar datos críticos para las evaluaciones de salud. Sin embargo, debido a la variabilidad en los comportamientos individuales, los factores ambientales y la ubicación física de los dispositivos, el rendimiento de los modelos genéricos de IA a menudo se ve obstaculizado. Esto es particularmente problemático cuando dichos modelos encuentran cambios en la distribución de los datos sensoriales, ya que las variaciones provocan un desajuste entre las condiciones de entrenamiento y prueba. Por lo tanto, la personalización es necesaria para adaptar estos modelos a patrones de usuario específicos, haciéndolos más efectivos y confiables para su uso en el mundo real.

La cuestión central que los investigadores pretenden abordar es el desafío de adaptar los modelos de IA a usuarios individuales cuando hay datos limitados disponibles o cuando los datos recopilados muestran variabilidad debido a cambios en las condiciones externas. Si bien son capaces de generalizarse a poblaciones más amplias, los modelos genéricos tienden a fallar cuando se enfrentan a variaciones únicas y específicas del usuario, como cambios en los patrones de movimiento, las características del habla o los indicadores de salud. Este problema se agrava en escenarios de atención médica donde la escasez de datos es común y las características únicas de los pacientes a menudo están subrepresentadas en los datos de capacitación. Además, la variabilidad intrausuario entre diferentes escenarios conduce a una falta de generalización, lo cual es fundamental para aplicaciones como la monitorización de la salud, donde las condiciones fisiológicas pueden cambiar significativamente con el tiempo debido a la progresión de la enfermedad o a intervenciones de tratamiento.

Se han propuesto varios métodos para personalizar modelos, incluidas técnicas de personalización continua y estática. La personalización continua implica la actualización del modelo en función de los datos recién adquiridos. Sin embargo, obtener datos reales para dichos datos en aplicaciones de atención médica puede requerir mucha mano de obra y supervisión clínica constante, lo que hace que este método sea inviable para implementaciones en tiempo real o a gran escala. Por otro lado, la personalización estática se produce durante la inscripción del usuario utilizando un conjunto de datos inicial limitado. Si bien esto reduce la sobrecarga computacional y minimiza la participación del usuario, generalmente da como resultado modelos que no se generalizan bien en contextos que no se ven durante la fase de inscripción inicial.

Investigadores de la Universidad de Syracuse y la Universidad Estatal de Arizona introdujeron un nuevo enfoque llamado CRoP (Personalización robusta de detección humana estática según el contexto). Este método aprovecha los modelos preentrenados disponibles en el mercado y los adapta mediante técnicas de poda para abordar el desafío de la variabilidad intrausuario. El enfoque CRoP es único en el uso de la poda de modelos, que implica eliminar parámetros redundantes del modelo personalizado y reemplazarlos por otros genéricos. Esta técnica ayuda a mantener la capacidad del modelo personalizado para generalizar en diferentes contextos invisibles y, al mismo tiempo, garantiza un alto rendimiento para el contexto en el que se entrenó. Con este método, los investigadores pueden crear modelos estáticos personalizados que funcionan de manera sólida incluso cuando las condiciones externas del usuario cambian significativamente.

El enfoque CRoP comienza ajustando un modelo genérico utilizando los datos limitados recopilados durante la inscripción inicial de un usuario. Luego, este modelo personalizado se recorta para identificar y eliminar parámetros redundantes que no contribuyen significativamente a la inferencia del modelo para el contexto dado. A continuación, los parámetros eliminados se reemplazan con los parámetros correspondientes del modelo genérico, restaurando efectivamente la generalización del modelo. El paso final implica ajustar aún más el modelo mixto con los datos de usuario disponibles para optimizar el rendimiento. Este proceso de tres pasos garantiza que el modelo personalizado conserve la capacidad de generalizarse en contextos invisibles sin comprometer su eficacia en el contexto en el que fue entrenado.

Los investigadores probaron el método en cuatro conjuntos de datos de detección humana: el conjunto de datos de terapia clínica del habla PERCERT-R, el conjunto de datos de reconocimiento de actividad basado en WiFi WIDAR, el conjunto de datos de detección móvil ExtraSensory y un conjunto de datos de detección de estrés recopilados a través de sensores portátiles. Los resultados muestran que CRoP logró un aumento del 35,23 % en la precisión de la personalización en comparación con los modelos genéricos y una mejora del 7,78 % en la generalización en comparación con los métodos de ajuste convencionales. Específicamente, en el conjunto de datos WIDAR, CRoP mejoró la precisión del 63,90 % al 87,06 % en el contexto primario, al tiempo que mantuvo una caída de rendimiento menor en contextos invisibles, lo que demuestra su solidez para adaptarse a diversos escenarios de usuario. De manera similar, en el conjunto de datos PERCEPT-R, CRoP arrojó una precisión del 67,81 % en el contexto inicial y mantuvo una estabilidad de rendimiento del 13,81 % en escenarios invisibles.

La investigación demuestra que los modelos CRoP superan a los métodos convencionales como SHOT, PackNet, Piggyback y CoTTA en personalización y generalización. Por ejemplo, mientras que PackNet logró solo una mejora del 26,05 % en personalización y una caída del -1,39 % en generalización, CRoP proporcionó una mejora del 35,23 % en personalización y una ganancia positiva del 7,78 % en generalización. Esto indica que el método de CRoP de integrar técnicas de poda y restauración es más efectivo para manejar los cambios de distribución comunes en las aplicaciones de detección humana.

Conclusiones clave de la investigación:

  • CRoP aumenta la precisión de la personalización en un 35,23% en comparación con los modelos genéricos.
  • Se logra una mejora de generalización del 7,78 % utilizando CRoP en comparación con el ajuste fino convencional.
  • En la mayoría de los conjuntos de datos, CRoP supera a otros métodos de última generación como SHOT y CoTTA entre un 9% y un 20%.
  • El método mantiene un alto rendimiento en diversos contextos con una mínima sobrecarga computacional adicional.
  • El enfoque es particularmente eficaz para aplicaciones relacionadas con la salud, donde los cambios en las condiciones del usuario son frecuentes y difíciles de predecir.

En conclusión, CRoP ofrece una solución novedosa para abordar las limitaciones de la personalización estática. Aprovechar los modelos disponibles en el mercado e incorporar técnicas de poda equilibra eficazmente el equilibrio entre la personalización intrausuario y la generalización. Este enfoque aborda la necesidad de modelos personalizados que funcionen bien en diferentes contextos, lo que lo hace particularmente adecuado para aplicaciones sensibles como la atención médica, donde la solidez y la adaptabilidad son cruciales.


Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro SubReddit de 52k+ ML.

Estamos invitando a startups, empresas e instituciones de investigación que estén trabajando en modelos de lenguajes pequeños a participar en este próximo Revista/Informe ‘Small Language Models’ de Marketchpost.com. Esta revista/informe se publicará a finales de octubre o principios de noviembre de 2024. ¡Haga clic aquí para programar una llamada!


A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.

Leer más
Back to top button