Patterns: Детский зрительный опыт поможет усовершенствовать компьютерное зрение

Новый подход к обучению систем искусственного интеллекта распознавать объекты и ориентироваться в окружающей обстановке может стать основой для разработки более совершенных систем ИИ для исследования экстремальных сред или далеких миров, говорится в исследовании междисциплинарной команды из Университета штата Пенсильвания.

В первые два года жизни дети видят несколько ограниченный набор объектов и лиц, но с разных точек зрения и при разном освещении. Вдохновленные этим развитием, исследователи представили новый подход к машинному обучению, который использует информацию о пространственном положении для более эффективного обучения визуальных систем ИИ. Они обнаружили, что модели ИИ, обученные по новому методу, превосходят базовые модели на 14,99%. О своих результатах они сообщили в майском номере журнала Patterns.

Современные подходы в области ИИ используют для обучения массивные наборы случайно перемешанных фотографий из интернета. В отличие от них, наша стратегия основана на психологии развития, которая изучает, как дети воспринимают мир, — говорит Лижэнь Чжу, ведущий автор и докторант Колледжа информационных наук и технологий штата Пенсильвания.

Исследователи разработали новый алгоритм контрастного обучения, который представляет собой разновидность метода самоконтроля, при котором система искусственного интеллекта учится обнаруживать визуальные паттерны, чтобы определить, когда два изображения являются производными от одного и того же базового изображения, в результате чего образуется положительная пара. Однако эти алгоритмы часто рассматривают изображения одного и того же объекта, снятые с разных ракурсов, как отдельные сущности, а не как положительные пары. По словам исследователей, учет данных об окружающей среде, включая местоположение, позволяет системе искусственного интеллекта преодолевать эти трудности и обнаруживать положительные пары независимо от изменения положения или поворота камеры, угла или условий освещения и фокусного расстояния, или зума.

Мы предположили, что визуальное обучение младенцев зависит от восприятия местоположения. Чтобы получить эгоцентрический набор данных с пространственно-временной информацией, мы создали виртуальную среду на платформе ThreeDWorld, которая представляет собой интерактивную 3D-среду физического моделирования с высокой степенью достоверности. Это позволило нам манипулировать и измерять расположение камер наблюдения, как если бы ребенок ходил по дому, — добавляет Чжу.

Ученые создали три среды моделирования — House14K, House100K и Apartment14K, причем «14K» и „100K“ означают приблизительное количество образцов изображений, полученных в каждой среде. Затем они прогнали базовые модели контрастного обучения и модели с новым алгоритмом через симуляции три раза, чтобы посмотреть, насколько хорошо каждая из них классифицирует изображения. Команда обнаружила, что модели, обученные по их алгоритму, превосходят базовые модели в целом ряде задач. Например, в задаче распознавания комнаты в виртуальной квартире дополненная модель справилась в среднем на 99,35%, что на 14,99% лучше, чем базовая модель. Эти новые наборы данных доступны для других ученых, которые могут использовать их для обучения на сайте www.child-view.com.

Моделям всегда сложно обучаться в новой среде с небольшим количеством данных. Наша работа представляет собой одну из первых попыток более энергоэффективного и гибкого обучения ИИ с использованием визуального контента, — говорит Джеймс Вон. заслуженный профессор информационных наук и технологий и советник Чжу.

По словам ученых, исследование имеет значение для будущего развития передовых систем искусственного интеллекта, способных ориентироваться и обучаться в новых условиях.

Такой подход будет особенно полезен в ситуациях, когда команде автономных роботов с ограниченными ресурсами необходимо научиться ориентироваться в совершенно незнакомой среде, — заключает Вон.

Чтобы проложить путь к будущим приложениям, мы планируем доработать нашу модель, чтобы лучше использовать пространственную информацию и включать в нее более разнообразные среды.

31.05.2024


Подписаться в Telegram



Net&IT

Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр
Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр

В сериале Звездный путь: Следующее поколение к...

Physical Review X: Сеть квантовых датчиков повышает точность измерений
Physical Review X: Сеть квантовых датчиков повышает точность измерений

Квантовые системы, используемые в квантов...

Scientific Reports: ИИ показал больший творческий потенциал, чем человек
Scientific Reports: ИИ показал больший творческий потенциал, чем человек

Еще один балл в пользу искусственного инт...

Крошечную метку на замену RFID сделали еще надежнее
Крошечную метку на замену RFID сделали еще надежнее

Несколько лет назад исследователи Массачу...

Ученые приблизились к более легким и гибким оптоэлектронным устройствам
Ученые приблизились к более легким и гибким оптоэлектронным устройствам

Органические оптоэлектронные устройства, такие...

PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить
PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить

Атанасиос С. Фокас рассматривает актуальный во...

Nature: ИИ генерирует белки с исключительной прочностью связывания
Nature: ИИ генерирует белки с исключительной прочностью связывания

В новом исследовании, опубликованном 18 декабр...

Nature Computational Science: ИИ может предсказывать события в жизни людей
Nature Computational Science: ИИ может предсказывать события в жизни людей

Искусственный интеллект, разработанный для&nbs...

Nature Electronics: Изменение памяти дает новые вычислительные возможности
Nature Electronics: Изменение памяти дает новые вычислительные возможности

Ученые Рочестерского университета разработали ...

Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта
Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта

Многофункциональные компьютерные чипы эволюцио...

Началась регистрация на конкурс «Битва искусственных интеллектов»
Началась регистрация на конкурс «Битва искусственных интеллектов»

Стартовал отборочный этап Международного техно...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Высокоточные измерения ставят под сомнение наше понимание Цефеид
Высокоточные измерения ставят под сомнение наше понимание Цефеид
Останется ли магний снотворным для кузнечиков в результате потепления?
Останется ли магний снотворным для кузнечиков в результате потепления?
Physical Review Letters: Ученые описали альтернативный магнетизм
Physical Review Letters: Ученые описали альтернативный магнетизм
APA: Молодые сотрудники чаще остальных страдают на работе от одиночества
APA: Молодые сотрудники чаще остальных страдают на работе от одиночества
Front. Aging Neurosci: Поведение в новом пространстве может подсветить деменцию
Front. Aging Neurosci: Поведение в новом пространстве может подсветить деменцию
JACS: Инфракрасное облучение заставляет атомы «танцевать румбу»
JACS: Инфракрасное облучение заставляет атомы «танцевать румбу»
С расстройствами пищевого поведения можно бороться силой мысли
С расстройствами пищевого поведения можно бороться силой мысли
Диспаритет женских и мужских карьер в STEM связан с женской мнительностью
Диспаритет женских и мужских карьер в STEM связан с женской мнительностью
Телескоп Уэбб снял столкновение астероидов в соседней звездной системе
Телескоп Уэбб снял столкновение астероидов в соседней звездной системе
EHJ-CI: Нарушенный кровоток может повредить стенку расширенной аорты
EHJ-CI: Нарушенный кровоток может повредить стенку расширенной аорты
Nature Neuroscience: Ученые доказали, что терпение приносит свои плоды
Nature Neuroscience: Ученые доказали, что терпение приносит свои плоды
Journal of Experimental Psychology: General: Мы переоцениваем пользу неудачи
Journal of Experimental Psychology: General: Мы переоцениваем пользу неудачи
Познакомьтесь со странной амфибией, которая выкармливает своих детенышей молоком
Познакомьтесь со странной амфибией, которая выкармливает своих детенышей молоком
Climate Dynamics: Вот как условия на суше влияют на муссонный климат Азии
Climate Dynamics: Вот как условия на суше влияют на муссонный климат Азии
В 40% случаев люди ошибочно называют сгенерированное фото человека реальным
В 40% случаев люди ошибочно называют сгенерированное фото человека реальным

Новости компаний, релизы

Московский Политех внедряет ИИ для повышения эффективности приемной кампании и трансформации обучения
Астрономы СПбГУ узнали возраст одного из самых мощных метеорных потоков
Исследования ученых ТПУ помогут в разработке таргетных препаратов для эффективной терапии в онкологии
Зоологи выявили тенденцию к увеличению числа защитных роговых элементов на панцире морских черепах на острове Шри-Ланка
Российские ученые нашли способ повысить урожайность подсолнечника на 43% с помощью нового серосодержащего удобрения