Radiology: ChatGPT не справился с интерпретацией радиологических снимков

Исследователи выяснили, что ChatGPT-4 Vision хорошо справляется с текстовыми вопросами экзамена по радиологии, но не может точно ответить на вопросы об изображениях.

Результаты исследования опубликованы в журнале Radiology.

Chat GPT-4 Vision — это первая версия языковой модели, которая может работать и с текстом, и с изображениями.

ChatGPT-4 помогает радиологам упростить подготовку отчётов для пациентов и определить подходящий протокол обследования, — говорит Чад Клочко, доктор медицинских наук. Он специализируется на заболеваниях опорно-двигательного аппарата и исследует искусственный интеллект в Henry Ford Health (Детройт, штат Мичиган). GPT-4 Vision обрабатывает изображения и может найти новые применения в радиологии.

Исследовательская группа доктора Клочко использовала вопросы из экзаменов по диагностической радиологии Американского колледжа радиологии для своего исследования. Эти тесты используются для оценки успехов ординаторов-радиологов.

После исключения дубликатов, исследователи использовали 377 вопросов из 13 областей. Из них 195 были текстовыми вопросами, а 182 — с изображениями.

Модель GPT-4 Vision правильно ответила на 246 из 377 вопросов, набрав 65,3%. Она правильно ответила на 81,5% текстовых запросов и на 47,8% вопросов с изображениями.

Точность ответов на текстовые вопросы составляет 81,5%. Это отражает результаты предшественника модели. Постоянство в ответах может говорить о том, что модель понимает текстовую информацию в радиологии.

В области радиологии мочеполовой системы GPT-4 Vision лучше справилась с вопросами с изображениями (67%, или 10 из 15), чем с текстовыми вопросами (57%, или 4 из 7). В других областях модель лучше отвечала на вопросы без изображений.

Модель лучше всего справилась с вопросами, содержащими изображения в грудной и мочеполовой областях — 69% и 67% правильных ответов соответственно.

Хуже всего модель отвечала на вопросы с изображениями из области ядерной медицины — только 2 ответа из 10 были верными.

Также в исследовании изучалось влияние различных подсказок на работу GPT-4 Vision.

  • Оригинал: Вы сдаете экзамен по радиологии. Изображения вопросов будут загружены. Выберите правильный ответ на каждый вопрос.
  • Основная: Выберите единственный лучший ответ на следующий вопрос экзамена по радиологии.
  • Краткая инструкция: Это вопрос для экзамена по радиологии, который нужен, чтобы проверить ваши медицинские знания. Выберите лучший вариант ответа.
  • Длинная инструкция: Вы являетесь сертифицированным врачом-рентгенологом, сдающим экзамен. Внимательно изучите каждый вопрос, а если вопрос дополнительно содержит изображение, внимательно изучите его, чтобы ответить на вопрос. Ваш ответ должен включать один наилучший вариант ответа. Отсутствие варианта ответа будет считаться неправильным.
  • Цепочка мыслей: Вы сдаете экзамен в исследовательских целях. Учитывая предоставленное изображение, продумайте шаг за шагом ответ на поставленный вопрос.

Хотя модель правильно ответила на 183 из 265 вопросов, она отказалась отвечать на 120. Большинство из них содержали изображение.

Мы не заметили такого поведения модели в ходе первоначального исследования, — говорит доктор Клочко.

Модель показала самую низкую точность (62,6%) при использовании коротких инструкций.

Наше исследование показало, что модель иногда даёт верные ответы на основании неверной интерпретации изображений. Это может иметь серьёзные последствия в клинической практике.

По словам доктора Клочко, необходимо разработать более строгие методы оценки эффективности больших языковых моделей в радиологии.

Он отметил, что GPT-4 Vision пока не подходит для работы в радиологии, поскольку могут возникнуть проблемы с интерпретацией изображений и ответы могут быть недостоверными.

03.09.2024


Подписаться в Telegram



Net&IT

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое
Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое

Исследование профессора Университета штата Фло...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

В СПбГУ создали светящиеся полимеры для датчиков и экранов гаджетов
В СПбГУ создали светящиеся полимеры для датчиков и экранов гаджетов
В МИФИ разработан виртуальный двойник токарного станка
В МИФИ разработан виртуальный двойник токарного станка
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
JMSER: Сульфиды металлов могут быть катализаторами для восстановления CO2
JMSER: Сульфиды металлов могут быть катализаторами для восстановления CO2
Small: Совершен прорыв в создании пленок с использованием оксида графена
Small: Совершен прорыв в создании пленок с использованием оксида графена
Palaeontology: У трилобитов нашли еще две пары ног с жабрами и шипами
Palaeontology: У трилобитов нашли еще две пары ног с жабрами и шипами
В ПНИПУ повысили точность расчета свойств деталей авиакосмического транспорта
В ПНИПУ повысили точность расчета свойств деталей авиакосмического транспорта
Учёные НИУ МЭИ создали энергоустановку на основе бионических технологий
Учёные НИУ МЭИ создали энергоустановку на основе бионических технологий
Nature Communications: Новая находка опровергла некоторые догмы эволюции
Nature Communications: Новая находка опровергла некоторые догмы эволюции
В УГНТУ разработали установку по переработке печной сажи в графен
В УГНТУ разработали установку по переработке печной сажи в графен
LPH: Есть возможность снизить давление на планету и избежать краха экосистемы
LPH: Есть возможность снизить давление на планету и избежать краха экосистемы
В ПИШ КАИ повышают эффективность управления дорожным движением
В ПИШ КАИ повышают эффективность управления дорожным движением
AJP: В 5 раз возрастает риск психоза у людей, принимающих стимуляторы
AJP: В 5 раз возрастает риск психоза у людей, принимающих стимуляторы
Выпускница ЛЭТИ разработала ПО для подбора сотрудников в соцсетях
Выпускница ЛЭТИ разработала ПО для подбора сотрудников в соцсетях
Nature Climate Change: Богатые тоже пачкают атмосферу
Nature Climate Change: Богатые тоже пачкают атмосферу

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Ученые Казанского аграрного университета нашли способ повысить урожайность картофеля в Татарстане
Регулярное орошение способно повысить урожайность картофеля на 70%
КАИ и Микрон будут готовить инженерные кадры для микроэлектроники
Ученые СПбГУ нашли «безопасную» зону для проведения операций при ишемии нижних конечностей