Исследователи выяснили, что ChatGPT-4 Vision хорошо справляется с текстовыми вопросами экзамена по радиологии, но не может точно ответить на вопросы об изображениях. Результаты исследования опубликованы в журнале Radiology. Chat GPT-4 Vision — это первая версия языковой модели, которая может работать и с текстом, и с изображениями. ChatGPT-4 помогает радиологам упростить подготовку отчётов для пациентов и определить подходящий протокол обследования, — говорит Чад Клочко, доктор медицинских наук. Он специализируется на заболеваниях опорно-двигательного аппарата и исследует искусственный интеллект в Henry Ford Health (Детройт, штат Мичиган). GPT-4 Vision обрабатывает изображения и может найти новые применения в радиологии. Исследовательская группа доктора Клочко использовала вопросы из экзаменов по диагностической радиологии Американского колледжа радиологии для своего исследования. Эти тесты используются для оценки успехов ординаторов-радиологов. После исключения дубликатов, исследователи использовали 377 вопросов из 13 областей. Из них 195 были текстовыми вопросами, а 182 — с изображениями. Модель GPT-4 Vision правильно ответила на 246 из 377 вопросов, набрав 65,3%. Она правильно ответила на 81,5% текстовых запросов и на 47,8% вопросов с изображениями. Точность ответов на текстовые вопросы составляет 81,5%. Это отражает результаты предшественника модели. Постоянство в ответах может говорить о том, что модель понимает текстовую информацию в радиологии. В области радиологии мочеполовой системы GPT-4 Vision лучше справилась с вопросами с изображениями (67%, или 10 из 15), чем с текстовыми вопросами (57%, или 4 из 7). В других областях модель лучше отвечала на вопросы без изображений. Модель лучше всего справилась с вопросами, содержащими изображения в грудной и мочеполовой областях — 69% и 67% правильных ответов соответственно. Хуже всего модель отвечала на вопросы с изображениями из области ядерной медицины — только 2 ответа из 10 были верными. Также в исследовании изучалось влияние различных подсказок на работу GPT-4 Vision.
Хотя модель правильно ответила на 183 из 265 вопросов, она отказалась отвечать на 120. Большинство из них содержали изображение.
Модель показала самую низкую точность (62,6%) при использовании коротких инструкций. Наше исследование показало, что модель иногда даёт верные ответы на основании неверной интерпретации изображений. Это может иметь серьёзные последствия в клинической практике. По словам доктора Клочко, необходимо разработать более строгие методы оценки эффективности больших языковых моделей в радиологии. Он отметил, что GPT-4 Vision пока не подходит для работы в радиологии, поскольку могут возникнуть проблемы с интерпретацией изображений и ответы могут быть недостоверными. 03.09.2024 |
Net&IT
Выпускница ЛЭТИ разработала ПО для подбора сотрудников в соцсетях | |
Приложение на основе нейросети поможет из... |
FBINF: Искать триггеры рака стало проще — на помощь пришел компьютерный алгоритм | |
Компьютерный алгоритм помогает находить генети... |
Разработан метод улучшения изображения, полученного при низкой освещенности | |
С развитием интеллектуальной эры все ... |
Nature Machine Intelligence: Генеративный ИИ берется за прогнозы в онкологии | |
Учёные из университетов Лозанны и Бе... |
Разработчик рассказал, когда искусственный интеллект превзойдет человеческий | |
Аналитик Эйтан Майкл Азофф считает, что л... |
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья | |
Новое приложение с искусственным интеллек... |
В ЛЭТИ разработали ПО для поисковых и спасательных дронов с компьютерным зрением | |
Учёные разрабатывают ПО, которое позволит дрон... |
В Киберателье УГНТУ создали «умную» одежду для работников нефтегазовой отрасли | |
Куртки с датчиками, изготовленные в ... |
В МТУСИ предложили усовершенствовать процессы SAST | |
Миллионы людей по всему миру ежедневно по... |
Radiology: ChatGPT не справился с интерпретацией радиологических снимков | |
Исследователи выяснили, что ChatGPT-4 Vis... |
Лабораторию цифровых двойников геосистем открыли в СПбГУТ | |
В Санкт-Петербургском университете телекоммуни... |
PNAS: Появилось новое решение одной из 10 самых известных проблем в информатике | |
Когда вы вызываете машину через приложени... |
Nature: Эксперимент провалился — ИИ не способен проводить лабораторные работы | |
Большая языковая модель может многое: читать л... |
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере | |
Исследование показало, что интеллект игра... |
MIT: Данным для обучения больших языковых моделей часто не хватает прозрачности | |
Исследователи создали простой инструмент, кото... |
Раскрыт потенциал связи 6G с помощью нового поляризационного мультиплексора | |
Терагерцовая связь — это новый... |
ИИ помогает контролировать землепользование и пресекать самострой в Москве | |
С начала года в столице с помощью ци... |
Autism: Игра Dungeons & Dragons помогает аутистам обрести уверенность в себе | |
Dungeons and Dragons — популярная р... |
Nature: Лестничные молекулы улучшают проводимость в молекулярных соединениях | |
Размеры электронных устройств становятся всё&n... |
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA | |
Исследователи предлагают новый способ создания... |
Science: ИИ решает одну из самых сложных задач в квантовой химии | |
Учёные из Имперского колледжа Лондона и&n... |
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой | |
Команда под руководством доктора Йошикацу... |
European Radiology: ИИ может заменить ординатора, но не опытного врача | |
В радиологии для интерпретации результато... |
Магистрант МАИ обучил нейронную сеть оптимизировать производство | |
Студент МАИ Семён Беляев предложил способ... |
Nature Reviews Materials: В поиске полимера будущего поможет ИИ | |
Нейлон, тефлон, кевлар — это л... |
Цифровой полигон МФТИ ускорит разработку БПЛА в России | |
Сотрудники передовой инженерной школы МФТИ пре... |
За 4 месяца модель ИИ научили исследовать урожайность полей | |
Модель искусственного интеллекта, созданная вы... |
NPJ Digital medicine: Мобильные приложения действительно держат нас в тонусе | |
Мобильные приложения, веб-сайты и текстов... |
JMST: Разработана умная ткань, которая следит за организмом и генерирует энергию | |
Представьте себе пальто, которое ловит солнечн... |
Physical Review E: Чем выше скорость принятия решения, тем скорее оно предвзятое | |
Исследование профессора Университета штата Фло... |