De bordes a nodos: el enfoque integral de SEGMN para graficar similitudes
En el mundo de hoy, Cálculo de similitud de gráficos (GSC) Juega un papel importante en diversas aplicaciones, como la detección de códigos, la similitud de gráficos moleculares, la coincidencia de imágenes, etc., al evaluar la similitud entre dos gráficos y se basa en el aprendizaje de similitud de gráficos. Distancia de edición de gráficos (GED) y Subgrafo común máximo (MCS) Se utilizan ampliamente para medir la similitud de gráficos. GED se refiere al número mínimo de operaciones que convierten un gráfico en otro, y MCS es el subgrafo más grande que es simultáneamente isomorfo (estructuralmente idéntico) a ambos gráficos. Sin embargo, calcular GED y MCS es difícil debido a problemas que pertenecen a una categoría llamada NP-completolo que significa que son extremadamente difíciles de resolver de manera eficiente, especialmente a medida que los gráficos se hacen más grandes. Algoritmos tradicionales como Hungría y A* puede calcular GED con precisión pero a costa de una alta complejidad computacional. Es importante calcular con precisión las puntuaciones de similitud de gráficos, ya que esto puede afectar significativamente sus aplicaciones.
Los métodos existentes para calcular la similitud de gráficos tienen dos inconvenientes principales:
1. Limitación de representación: Una representación completa permite combinar desde múltiples perspectivas. La mayoría de los métodos solo utilizan incrustaciones de nodos simples sin resaltar la representación de los bordes, lo cual es crucial para comparar estructuras con precisión.
2. Inadecuación de concordancia: Algunos recientes GSC uso de métodos Redes neuronales gráficas (GNN) para aprovechar las estructuras intra-gráfico en el paso de mensajes. Sin embargo, la mayoría de ellos necesitan utilizar plenamente la información presentada por los bordes para mejorar la representación de los nodos conectados. Además, la coincidencia de incrustación de nodos de gráficos cruzados anterior debe incluir una imagen más amplia de la estructura general del par de gráficos porque las representaciones de nodos de GNN solo se centran en la estructura intragráfico, lo que provoca una puntuación de similitud irrazonable.
Para superar los inconvenientes de trabajos anteriores, investigadores de la Universidad de Correos y Telecomunicaciones de Nanjing propusieron un Red de coincidencia de gráficos mejorada de estructura (SEGMN) estructura. Equipado con un módulo de aprendizaje de doble integración y un módulo de coincidencia de percepción de estructura, SEGMN logra una mejora de la estructura tanto en el aprendizaje integrado como en la coincidencia de gráficos cruzados. Este marco propuesto consta de cuatro módulos: aprendizaje de integración dual, interacción entre gráficos, coincidencia de percepción de estructura y aprendizaje de matriz de similitud.
El módulo de aprendizaje de integración dual se puede dividir en tres pasos. Un borde mejorado GCN se aplica al gráfico de líneas para incrustar bordes. En segundo lugar, un GCN con conexiones residuales se aplica al gráfico de nodos para su incrustación. En tercer lugar, cada nodo agrega las incrustaciones de bordes conectados para generar la incrustación dual definitiva. Esta incrustación dual se utiliza para la coincidencia de gráficos cruzados a nivel de nodo, donde se adopta la atención nodo-gráfico para calcular la puntuación de similitud de cada par de nodos. La coincidencia de percepción de estructura mejora estas puntuaciones al considerar las relaciones estructurales entre pares de nodos en los gráficos. Finalmente, la matriz de similitud se refina mediante convolución y autoatención para producir puntuaciones de similitud precisas, con una función de pérdida basada en el error cuadrático medio para optimizar las predicciones del modelo.
Los investigadores evaluaron SEGMN utilizando tres conjuntos de datos de referencia del mundo real: SIDA, LINUXy IMDB, y lo comparó con otros grupos de líneas de base como GCN, GIN, GAT, SimGNN y GraphSim. Tras la evaluación, el método propuesto superó a otros modelos en términos de error cuadrático medio (MSE), correlación de rango de Spearman (ρ), Tau de Kendall (τ) y precisión en el top 10 (p@10), con el módulo de coincidencia de percepción de estructura aún más. mejorando el rendimiento hasta 25%.
En conclusión, el marco propuesto se basa en un módulo de aprendizaje de integración dual y un módulo de percepción de coincidencia de estructuras, que funcionan mejor que los métodos tradicionales y mitigan sus problemas. También ofrece una solución sólida para el cálculo de similitud de gráficos al proporcionar una forma sólida de calcularlo con mayor precisión. ¡Esta investigación marca un paso esencial hacia la comprensión del cálculo de similitud de gráficos y puede servir como base para futuras investigaciones en este dominio!
Mira el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa.. No olvides unirte a nuestro SubReddit de más de 55.000 ml.
(Revista/Informe AI) Lea nuestro último informe sobre ‘MODELOS DE LENGUAS PEQUEÑAS‘
Divyesh es pasante de consultoría en Marktechpost. Está cursando un BTech en Ingeniería Agrícola y Alimentaria en el Instituto Indio de Tecnología de Kharagpur. Es un entusiasta de la ciencia de datos y el aprendizaje automático que quiere integrar estas tecnologías líderes en el ámbito agrícola y resolver desafíos.
Escuche nuestros últimos podcasts de IA y vídeos de investigación de IA aquí ➡️