Patterns: Детский зрительный опыт поможет усовершенствовать компьютерное зрение

31.05.20241924

Новый подход к обучению систем искусственного интеллекта распознавать объекты и ориентироваться в окружающей обстановке может стать основой для разработки более совершенных систем ИИ для исследования экстремальных сред или далеких миров, говорится в исследовании междисциплинарной команды из Университета штата Пенсильвания.

Patterns: Детский зрительный опыт поможет усовершенствовать компьютерное зрение

В первые два года жизни дети видят несколько ограниченный набор объектов и лиц, но с разных точек зрения и при разном освещении. Вдохновленные этим развитием, исследователи представили новый подход к машинному обучению, который использует информацию о пространственном положении для более эффективного обучения визуальных систем ИИ. Они обнаружили, что модели ИИ, обученные по новому методу, превосходят базовые модели на 14,99%. О своих результатах они сообщили в майском номере журнала Patterns.

Современные подходы в области ИИ используют для обучения массивные наборы случайно перемешанных фотографий из интернета. В отличие от них, наша стратегия основана на психологии развития, которая изучает, как дети воспринимают мир, — говорит Лижэнь Чжу, ведущий автор и докторант Колледжа информационных наук и технологий штата Пенсильвания.

Исследователи разработали новый алгоритм контрастного обучения, который представляет собой разновидность метода самоконтроля, при котором система искусственного интеллекта учится обнаруживать визуальные паттерны, чтобы определить, когда два изображения являются производными от одного и того же базового изображения, в результате чего образуется положительная пара. Однако эти алгоритмы часто рассматривают изображения одного и того же объекта, снятые с разных ракурсов, как отдельные сущности, а не как положительные пары. По словам исследователей, учет данных об окружающей среде, включая местоположение, позволяет системе искусственного интеллекта преодолевать эти трудности и обнаруживать положительные пары независимо от изменения положения или поворота камеры, угла или условий освещения и фокусного расстояния, или зума.

Мы предположили, что визуальное обучение младенцев зависит от восприятия местоположения. Чтобы получить эгоцентрический набор данных с пространственно-временной информацией, мы создали виртуальную среду на платформе ThreeDWorld, которая представляет собой интерактивную 3D-среду физического моделирования с высокой степенью достоверности. Это позволило нам манипулировать и измерять расположение камер наблюдения, как если бы ребенок ходил по дому, — добавляет Чжу.

Ученые создали три среды моделирования — House14K, House100K и Apartment14K, причем «14K» и „100K“ означают приблизительное количество образцов изображений, полученных в каждой среде. Затем они прогнали базовые модели контрастного обучения и модели с новым алгоритмом через симуляции три раза, чтобы посмотреть, насколько хорошо каждая из них классифицирует изображения. Команда обнаружила, что модели, обученные по их алгоритму, превосходят базовые модели в целом ряде задач. Например, в задаче распознавания комнаты в виртуальной квартире дополненная модель справилась в среднем на 99,35%, что на 14,99% лучше, чем базовая модель. Эти новые наборы данных доступны для других ученых, которые могут использовать их для обучения на сайте www.child-view.com.

Моделям всегда сложно обучаться в новой среде с небольшим количеством данных. Наша работа представляет собой одну из первых попыток более энергоэффективного и гибкого обучения ИИ с использованием визуального контента, — говорит Джеймс Вон. заслуженный профессор информационных наук и технологий и советник Чжу.

По словам ученых, исследование имеет значение для будущего развития передовых систем искусственного интеллекта, способных ориентироваться и обучаться в новых условиях.

Такой подход будет особенно полезен в ситуациях, когда команде автономных роботов с ограниченными ресурсами необходимо научиться ориентироваться в совершенно незнакомой среде, — заключает Вон.

Чтобы проложить путь к будущим приложениям, мы планируем доработать нашу модель, чтобы лучше использовать пространственную информацию и включать в нее более разнообразные среды.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Почему нейросети до сих пор не понимают, что творят
Почему нейросети до сих пор не понимают, что творят

Триллионы параметров, миллиарды вычислений&nbs...

Российские ИИ и 3D-принтеры победили на конкурсе БРИКС
Российские ИИ и 3D-принтеры победили на конкурсе БРИКС

Российские стартапы доказали, что могут к...

Ученые СПбГУ упростили расчеты для стабильной связи
Ученые СПбГУ упростили расчеты для стабильной связи

Представьте, что ваш телефон внезапн...

Невидимый хвост: почему чистка куки не спасает от слежки
Невидимый хвост: почему чистка куки не спасает от слежки

Вы чистите куки и думаете, что тепер...

Ученые изобрели способ записывать информацию во льду
Ученые изобрели способ записывать информацию во льду

Вместо облачных технологий — ледяны...

Чем рискуют ученые, доверяя ИИ свои статьи
Чем рискуют ученые, доверяя ИИ свои статьи

Ошибка алгоритма может стоить исследователю ре...

От 5G до квантов: как сети учатся выживать в мире перегрузок
От 5G до квантов: как сети учатся выживать в мире перегрузок

Иногда один оборванный кабель оставляет целую ...

Ученые нашли способ уменьшить нейросети без потери качества
Ученые нашли способ уменьшить нейросети без потери качества

Глубокое обучение напоминает бардак в шка...

Новый чип ускоряет обработку сигналов в 100 раз
Новый чип ускоряет обработку сигналов в 100 раз

Обычный ИИ тратит на анализ сигналов...

Ученые создали идеальный генератор чисел
Ученые создали идеальный генератор чисел

Что, если случайность — не&nbs

Надежно как в ДНК: когда данные начнут жить тысячелетиями
Надежно как в ДНК: когда данные начнут жить тысячелетиями

Жесткие диски выходят из строя а мол...

ИИ помогает неопытным таксистам работать наравне с профи
ИИ помогает неопытным таксистам работать наравне с профи

Таксисты в Японии случайно доказали, что&...

Как ИИ меняет бизнес и творческие профессии
Как ИИ меняет бизнес и творческие профессии

Споры о том, заменит ли ИИ люде...

Успешно испытан ИИ для диагностики кожных заболеваний
Успешно испытан ИИ для диагностики кожных заболеваний

Представьте инструмент, который замечает рак&n...

Поиск на сайте

ТОП - Новости мира, инновации

Новости компаний, релизы

ITPOD обновил номенклатуру серверов — разбираем обозначения
Автономные дроны без веб-интерфейса: просто API и никаких сложностей
Стажировка на Казанском вертолетном заводе – как студенты осваивали авиастроение
Как Самолет ускорил работу девелоперов в 7 раз
Как учат инноваторов: новый подход Московского Политеха