Patterns: Детский зрительный опыт поможет усовершенствовать компьютерное зрение

Новый подход к обучению систем искусственного интеллекта распознавать объекты и ориентироваться в окружающей обстановке может стать основой для разработки более совершенных систем ИИ для исследования экстремальных сред или далеких миров, говорится в исследовании междисциплинарной команды из Университета штата Пенсильвания.

В первые два года жизни дети видят несколько ограниченный набор объектов и лиц, но с разных точек зрения и при разном освещении. Вдохновленные этим развитием, исследователи представили новый подход к машинному обучению, который использует информацию о пространственном положении для более эффективного обучения визуальных систем ИИ. Они обнаружили, что модели ИИ, обученные по новому методу, превосходят базовые модели на 14,99%. О своих результатах они сообщили в майском номере журнала Patterns.

Современные подходы в области ИИ используют для обучения массивные наборы случайно перемешанных фотографий из интернета. В отличие от них, наша стратегия основана на психологии развития, которая изучает, как дети воспринимают мир, — говорит Лижэнь Чжу, ведущий автор и докторант Колледжа информационных наук и технологий штата Пенсильвания.

Исследователи разработали новый алгоритм контрастного обучения, который представляет собой разновидность метода самоконтроля, при котором система искусственного интеллекта учится обнаруживать визуальные паттерны, чтобы определить, когда два изображения являются производными от одного и того же базового изображения, в результате чего образуется положительная пара. Однако эти алгоритмы часто рассматривают изображения одного и того же объекта, снятые с разных ракурсов, как отдельные сущности, а не как положительные пары. По словам исследователей, учет данных об окружающей среде, включая местоположение, позволяет системе искусственного интеллекта преодолевать эти трудности и обнаруживать положительные пары независимо от изменения положения или поворота камеры, угла или условий освещения и фокусного расстояния, или зума.

Мы предположили, что визуальное обучение младенцев зависит от восприятия местоположения. Чтобы получить эгоцентрический набор данных с пространственно-временной информацией, мы создали виртуальную среду на платформе ThreeDWorld, которая представляет собой интерактивную 3D-среду физического моделирования с высокой степенью достоверности. Это позволило нам манипулировать и измерять расположение камер наблюдения, как если бы ребенок ходил по дому, — добавляет Чжу.

Ученые создали три среды моделирования — House14K, House100K и Apartment14K, причем «14K» и „100K“ означают приблизительное количество образцов изображений, полученных в каждой среде. Затем они прогнали базовые модели контрастного обучения и модели с новым алгоритмом через симуляции три раза, чтобы посмотреть, насколько хорошо каждая из них классифицирует изображения. Команда обнаружила, что модели, обученные по их алгоритму, превосходят базовые модели в целом ряде задач. Например, в задаче распознавания комнаты в виртуальной квартире дополненная модель справилась в среднем на 99,35%, что на 14,99% лучше, чем базовая модель. Эти новые наборы данных доступны для других ученых, которые могут использовать их для обучения на сайте www.child-view.com.

Моделям всегда сложно обучаться в новой среде с небольшим количеством данных. Наша работа представляет собой одну из первых попыток более энергоэффективного и гибкого обучения ИИ с использованием визуального контента, — говорит Джеймс Вон. заслуженный профессор информационных наук и технологий и советник Чжу.

По словам ученых, исследование имеет значение для будущего развития передовых систем искусственного интеллекта, способных ориентироваться и обучаться в новых условиях.

Такой подход будет особенно полезен в ситуациях, когда команде автономных роботов с ограниченными ресурсами необходимо научиться ориентироваться в совершенно незнакомой среде, — заключает Вон.

Чтобы проложить путь к будущим приложениям, мы планируем доработать нашу модель, чтобы лучше использовать пространственную информацию и включать в нее более разнообразные среды.

31.05.2024


Подписаться в Telegram



Net&IT

Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом
Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом

Генеративный искусственный интеллект часто оши...

JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья
JID: Новый анализ волос с помощью ИИ улучшит исследование здоровья

Новое приложение с искусственным интеллек...

В МТУСИ предложили усовершенствовать процессы SAST
В МТУСИ предложили усовершенствовать процессы SAST

Миллионы людей по всему миру ежедневно по...

Лабораторию цифровых двойников геосистем открыли в СПбГУТ
Лабораторию цифровых двойников геосистем открыли в СПбГУТ

В Санкт-Петербургском университете телекоммуни...

IJHCS: Пожилые хуже справляются с простыми задачами на компьютере
IJHCS: Пожилые хуже справляются с простыми задачами на компьютере

Исследование показало, что интеллект игра...

MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA
MIT: Создан алгоритм квантового компьютера для взлома криптосистемы RSA

Исследователи предлагают новый способ создания...

Science: ИИ решает одну из самых сложных задач в квантовой химии
Science: ИИ решает одну из самых сложных задач в квантовой химии

Учёные из Имперского колледжа Лондона и&n...

CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой
CRPS: Гидрогель научили играть в пинг-понг, и он делает это как живой

Команда под руководством доктора Йошикацу...

European Radiology: ИИ может заменить ординатора, но не опытного врача
European Radiology: ИИ может заменить ординатора, но не опытного врача

В радиологии для интерпретации результато...

Цифровой полигон МФТИ ускорит разработку БПЛА в России
Цифровой полигон МФТИ ускорит разработку БПЛА в России

Сотрудники передовой инженерной школы МФТИ пре...

За 4 месяца модель ИИ научили исследовать урожайность полей
За 4 месяца модель ИИ научили исследовать урожайность полей

Модель искусственного интеллекта, созданная вы...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

EES Catalysis: Новые ячейки превращают углекислый газ в экологичное топливо
EES Catalysis: Новые ячейки превращают углекислый газ в экологичное топливо
Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом
Rice: Полидактилия и другие странности анатомии от ИИ останутся в прошлом
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Brain Communications: Разработан экспресс-тест для диагностики БАС по крови
Science Advances: Большие узоры на лепестках гибискуса привлекают больше пчел
Science Advances: Большие узоры на лепестках гибискуса привлекают больше пчел
JMSER: Сульфиды металлов могут быть катализаторами для восстановления CO2
JMSER: Сульфиды металлов могут быть катализаторами для восстановления CO2
В СПбГУ создали светящиеся полимеры для датчиков и экранов гаджетов
В СПбГУ создали светящиеся полимеры для датчиков и экранов гаджетов
ACS Nano: Новое открытие улучшит дизайн микроэлектронных устройств
ACS Nano: Новое открытие улучшит дизайн микроэлектронных устройств
В МИФИ разработан виртуальный двойник токарного станка
В МИФИ разработан виртуальный двойник токарного станка
Small: Совершен прорыв в создании пленок с использованием оксида графена
Small: Совершен прорыв в создании пленок с использованием оксида графена
IEEE TSP: Низкоорбитальные спутники можно сделать высокопроизводительными
IEEE TSP: Низкоорбитальные спутники можно сделать высокопроизводительными
Annals of Internal Medicine: Ложноположительные результаты распугивают пациенток
Annals of Internal Medicine: Ложноположительные результаты распугивают пациенток
ACS Energy Letters: Новую батарею можно резать, можно бить — все равно работает
ACS Energy Letters: Новую батарею можно резать, можно бить — все равно работает
Palaeontology: У трилобитов нашли еще две пары ног с жабрами и шипами
Palaeontology: У трилобитов нашли еще две пары ног с жабрами и шипами
Science: Разработан метод поиска молекул, подходящих всем известным белкам
Science: Разработан метод поиска молекул, подходящих всем известным белкам
PNAS: «Тихие» мутации могут иметь последствия не только для собственного гена
PNAS: «Тихие» мутации могут иметь последствия не только для собственного гена

Новости компаний, релизы

Впервые выбирают MITEX: дебютанты выставки 2024 года
Казанский ГАУ запускает акселератор Smart АгроБио Tech для студенческих агростартапов
Стартовал пятый юбилейный конкурс Мэра «Новатор Москвы»
В Петербурге снизилось количество разрушающих озоновый слой газов
Около 25 млн рублей инвестиций привлек маркетплейс автозапчастей, созданный выпускниками вузов