Как Counterfactual SMOTE улучшает диагностику редких заболеваний

В медицине машинное обучение помогает выявлять болезни на ранних стадиях и подбирать лечение.

Но есть проблема: данные часто несбалансированы. Например, редкие заболевания в выборках встречаются намного реже, чем обычные случаи. Из-за этого алгоритмы учатся игнорировать редкие, но опасные состояния, сосредотачиваясь на большинстве.

Результаты опубликованы в издании Data Science and Management.

Существующие методы вроде SMOTE (Synthetic Minority Oversampling Technique) пытаются исправить дисбаланс, создавая искусственные примеры редких случаев. Но часто эти данные получаются зашумленными или бесполезными, что ведет к ошибкам в диагностике.

25 января 2025 года исследователи Гонсалу Алмейда и Фернандо Бакао из NOVA Information Management School представили улучшенный метод — Counterfactual SMOTE. Вместо случайной генерации данных он создает синтетические примеры рядом с границами решений, где ошибки классификации наиболее вероятны. Это позволяет точнее определять редкие случаи без лишнего шума.

Метод протестировали на 24 медицинских наборах данных. Результаты показали:

  • Улучшение точности (F1-score) на 10% по сравнению с аналогами.
  • Снижение числа пропущенных редких случаев на 24–34%.
  • Минимальный рост ложных срабатываний.

Хотя алгоритм требует больше вычислений, его точность оправдывает затраты, особенно в критических областях вроде медицины.

Гонсалу Алмейда, руководитель исследования:

Наш метод не просто уравновешивает данные — он заставляет модели учиться распознавать редкие случаи, а не угадывать большинство. Это важно для диагностики, где каждая ошибка может стоить жизни.

Counterfactual SMOTE полезен не только в медицине. Например:

  1. В финансах — для выявления редких мошеннических операций, что было бы полезно, например, для банков.
  2. В телекоме — для прогнозирования оттока клиентов.
  3. В производстве — для обнаружения дефектов.

Код метода уже открыт, и в будущем его можно адаптировать для работы с категориальными данными и многоклассовыми задачами.

Главный плюс Counterfactual SMOTE — практичность. Большинство методов борьбы с дисбалансом либо создают шум, либо требуют тонкой настройки. Этот подход автоматически генерирует полезные данные, не перегружая модель ложными срабатываниями.

Особенно ценно, что метод не требует изменения архитектуры моделей — его можно внедрить в существующие системы.

Для медицины, где ложные диагнозы дорого обходятся, даже 10% рост точности — прорыв.

Открытый код ускоряет внедрение в других областях: от банковского мониторинга до контроля качества на заводах.

Ранее мы выяснили, какие профессии вытеснит ИИ.

18.04.2025

Подписаться: Телеграм | Дзен | Вконтакте


Здоровье

Последний надрез: как клетка избегает катастрофы в финале деления
Последний надрез: как клетка избегает катастрофы в финале деления

Когда при делении клетки между хромосомам...

60% здоровых людей в зоне риска: что не так с вашим уровнем натрия в крови
60% здоровых людей в зоне риска: что не так с вашим уровнем натрия в крови

Исследование Университета Бар-Илан показало, ч...

Бактерии используют Cat1, чтобы лишить вирусы энергии
Бактерии используют Cat1, чтобы лишить вирусы энергии

Каждое живое существо на Земле защищается...

Не только память: Альцгеймер наносит скрытые удары по всему организму
Не только память: Альцгеймер наносит скрытые удары по всему организму

Хотя болезнь Альцгеймера считается заболевание...

Frontier in Public Health: НИПТ в два раза точнее выявляет синдром Дауна
Frontier in Public Health: НИПТ в два раза точнее выявляет синдром Дауна

Исследование, проведенное учеными из боль...

Ученые нашли РНК, которая помогает раку толстой кишки выживать
Ученые нашли РНК, которая помогает раку толстой кишки выживать

Рак толстой кишки остается одним из самых...

Ложный диагноз: деменцию в расцвете лет принимают за депрессию
Ложный диагноз: деменцию в расцвете лет принимают за депрессию

Деменция чаще ассоциируется с пожилыми лю...

Химическая кухня: почему еда в коробках опаснее, чем кажется
Химическая кухня: почему еда в коробках опаснее, чем кажется

Ученые бьют тревогу: синтетические химикаты в&...

Легкие не ждут сорока — они стареют раньше, чем вы думали
Легкие не ждут сорока — они стареют раньше, чем вы думали

Исследователи из Барселонского института ...

Создан новый инструмент для точного редактирования генов
Создан новый инструмент для точного редактирования генов

Ученые давно мечтали о точном инструменте...

Ученые нашли причину мозгового тумана после ковида
Ученые нашли причину мозгового тумана после ковида

Новое исследование впервые сравнило, как ...

Когда диета бессильна: ученые нашли скрытую причину целиакии
Когда диета бессильна: ученые нашли скрытую причину целиакии

Ученые наконец-то поняли, почему у некото...

Ученые вырастили амниотический мешок из стволовых клеток
Ученые вырастили амниотический мешок из стволовых клеток

Ученые из Института Фрэнсиса Крика создал...

Воспаление и прогестерон: вот почему не наступает беременность
Воспаление и прогестерон: вот почему не наступает беременность

Воспаление в женской репродуктивной систе...

ИИ предсказывает устойчивость бактерий к дезинфекции
ИИ предсказывает устойчивость бактерий к дезинфекции

Группа ученых, включая специалистов из На...

Возраст и курение родителей влияют на гены ребенка
Возраст и курение родителей влияют на гены ребенка

Родители передают детям не только гены, н...

Воспаление при синдроме Марфана вредит нервной системе
Воспаление при синдроме Марфана вредит нервной системе

Исследование Института нейронаук Автономного у...

Поиск на сайте

ТОП - Новости мира, инновации

Квантовые песчинки: самый маленький катализатор добывает водород из воды
Квантовые песчинки: самый маленький катализатор добывает водород из воды
Последний надрез: как клетка избегает катастрофы в финале деления
Последний надрез: как клетка избегает катастрофы в финале деления
Социальные роботы учатся общаться без участия людей
Социальные роботы учатся общаться без участия людей
Магнитные вихри помогут создать энергоэффективную электронику
Магнитные вихри помогут создать энергоэффективную электронику
Чувствуй как робот: кончики пальцев заменят инструкцию по технике безопасности
Чувствуй как робот: кончики пальцев заменят инструкцию по технике безопасности
Ученые выяснили, как пена теряет жидкость
Ученые выяснили, как пена теряет жидкость
Материалы с памятью: что общего у стекла и живой клетки
Материалы с памятью: что общего у стекла и живой клетки
60% здоровых людей в зоне риска: что не так с вашим уровнем натрия в крови
60% здоровых людей в зоне риска: что не так с вашим уровнем натрия в крови
Immunity: Жирная еда ослабляет кишечник за два дня
Immunity: Жирная еда ослабляет кишечник за два дня
Тревога не приходит одна: как осознанность учит мозг справляться
Тревога не приходит одна: как осознанность учит мозг справляться

Новости компаний, релизы

Как Камчатский университет развивает науку: новые лаборатории и открытия
От школьных проектов до заводских решений: чем живет нефтехимия в Нижнекамске
Бактерии против грибов: как наука защищает картофель без химии
Овцы вместо мышей: как ученые нашли новый способ тестировать материалы для зубов
Пробирки, зелень и взрывы: фестиваль для тех, кто любит науку