Лишние узлы — долой: нейросеть научилась видеть главное в графах

Максим Наговицын16.05.2025626

Исследователи из Университета Кумамото разработали новую модель глубокого обучения, которая решает давнюю проблему в анализе графов — поиск нужных фрагментов в сложных сетях.

Лишние узлы — долой: нейросеть научилась видеть главное в графах
Цвета узлов обозначают разные типы данных: белым выделены лишние (несущественные) элементы. В стандартном методе они влияют на нужные узлы, что приводит к ошибкам. Новая модель решает проблему — она находит и игнорирует лишнее. Источник: Masato Kiyama

Это важно для разработки лекарств, обработки естественного языка и других областей, где данные представляют в виде связей между объектами.

Результаты опубликованы в издании IEEE Access.

Обычные нейросети для работы с графами (GNN) часто ошибаются, когда в данных есть лишние узлы, не относящиеся к искомому образцу. Чтобы это исправить, команда профессора Мотооки Амагасаки и доцента Масато Киямы создала ENDNet — модель, которая умеет находить и «отключать» мешающие узлы.

ENDNet работает в три этапа:

  • Обнаружение лишних узлов — модель вычисляет, какие элементы графа не совпадают с образцом, и обнуляет их влияние.
  • Одностороннее распространение — улучшает сопоставление признаков между искомым фрагментом и данными.
  • Общая свертка графа — новый способ обработки данных с помощью сигмоидных функций, который делает анализ точнее.

Тесты на четырех открытых наборах данных показали, что ENDNet превосходит аналоги. Например, на данных COX2 точность выросла с 91,6% до 99,1%. Каждый компонент модели доказал свою эффективность.

ENDNet открывает новые возможности для анализа биологических сетей, молекулярных структур и социальных графов, — говорит доцент Кияма.

В будущем мы планируем масштабировать модель для работы с большими объемами данных.

Этот метод может ускорить:

  • Разработку лекарств — поиск фрагментов молекул в базах данных станет точнее, что сократит время на предсказание свойств соединений.
  • Анализ соцсетей — выявление скрытых сообществ или ботов в графах взаимодействий.
  • Компьютерное зрение — распознавание объектов в сценах с помехами.

Главное преимущество — снижение зависимости от ручной настройки алгоритмов.

Отметим, что модель тестировали на относительно небольших наборах данных. В реальных задачах, например, при анализе белковых взаимодействий, графы могут быть на порядки сложнее. Пока неясно, как ENDNet поведет себя в таких условиях.

Ранее ученые разработали нейросеть для синтеза голографических изображений.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Поиск на сайте

Лента новостей

Пресс-релизы