MIT: В помощь роботам создан метод для обнаружения нужных объектов

Недавно разработанный в MIT метод под названием Clio помогает роботам быстро составлять карту местности и определять, что нужно сделать.

Например, если вы хотите навести порядок на кухне и сначала вытереть стол, то можно смести все пакеты с соусом в одну кучу. Если же вы сначала хотите отобрать пакетики с горчицей, а потом выбросить остальные, то вы будете сортировать их более внимательно. А если среди всей горчицы вам понадобился именно Grey Poupon, то искать его вы будете особенно тщательно.

Инженеры из Массачусетского технологического института создали метод Clio, который позволяет роботам принимать интуитивные решения в зависимости от задачи.

Робот получает список задач на естественном языке и определяет уровень детализации для интерпретации окружающей обстановки. Робот «запоминает» только те части сцены, которые имеют значение.

Команда провела эксперименты в разных локациях: от захламлённого кабинета до пятиэтажного здания в кампусе Массачусетского технологического института. В этих экспериментах команда использовала метод Clio для автоматического сегментирования сцены на разных уровнях детализации. Задачи задавались на естественном языке, например: «передвинуть стеллаж с журналами» или „достать аптечку“.

Команда запустила Clio на четвероногом роботе в режиме реального времени.

Clio определял и отображал только те части сцены, которые относились к задачам робота (например, поиск игрушки для собаки). Это позволяло роботу схватывать интересующие его объекты.

Clio (Клио) названа так в честь греческой музы истории. Исследователи считают, что она может пригодиться во многих ситуациях и средах, где робот должен быстро изучать обстановку в контексте поставленной задачи.

Лука Карлоне, доцент кафедры аэронавтики и астронавтики Массачусетского технологического института, главный исследователь в Лаборатории систем информации и принятия решений и директор Лаборатории MIT SPARK, рассказывает, что основная область применения работы — это поиск и спасение.

Также Clio может управлять домашними и производственными роботами, работающими рядом с людьми. Задача заключается в том, чтобы помочь роботу понять окружающую обстановку и запомнить необходимые данные для выполнения миссии.

Результаты опубликованы в журнале Robotics and Automation Letters.

Открытые области

Благодаря достижениям в компьютерном зрении и обработке естественного языка, роботы теперь могут распознавать объекты вокруг себя. Раньше это было возможно только в контролируемой среде с ограниченным набором объектов, которые робот мог распознать.

Исследователи применяют более «открытый» подход, чтобы позволить роботам распознавать объекты в реальных условиях.

Они используют инструменты глубокого обучения для создания нейронных сетей. Такие сети могут обрабатывать миллиарды изображений из интернета вместе с текстом, связанным с каждым изображением (например, фотографию собаки с подписью «Познакомьтесь с моим новым щенком!»).

Нейронная сеть обучается на миллионах пар «изображение-текст» и определяет сегменты сцены, связанные с определёнными терминами, например „собака“.

Робот может использовать эту нейронную сеть, чтобы найти собаку в новой сцене. Однако всё ещё существует проблема анализа сцены для конкретной задачи.

Маджио отмечает, что типичные методы выбирают произвольный уровень детализации для определения того, как объединить сегменты в «объект». Но если этот уровень не учитывает задачи робота, то полученная карта будет бесполезной.

Информационное узкое место

Команда Массачусетского технологического института создала робота Clio, который может детально анализировать окружающую обстановку и автоматически подстраиваться под задачи.

Например, если робот должен поставить стопку книг на полку, он определит её как объект, имеющий отношение к задаче. А если нужно переместить только зелёную книгу, то робот выделит её как целевой объект и проигнорирует остальные книги в стопке.

Команда использует сочетание компьютерного зрения и больших языковых моделей, основанных на нейронных сетях. Они анализируют миллионы изображений и текстов из открытых источников.

Также применяются инструменты картографии, которые автоматически делят изображение на мелкие сегменты. Затем эти сегменты подаются в нейросеть для определения семантического сходства.

Далее применяется идея из теории информации под названием «информационное узкое место». С её помощью ряд сегментов изображения сжимается так, чтобы выбрать и сохранить наиболее релевантные для задачи.

Например, моя задача — достать зелёную книгу из стопки. Мы рассматриваем всю информацию о сцене через задачу достать книгу и получаем набор элементов, которые представляют зелёную книгу, — объясняет Мадджио.

Остальные элементы группируются в кластер, который можно удалить. В итоге остаётся объект нужной детализации для решения задачи.

Исследователи показали Clio в действии в разных условиях. Маджио рассказывает, что самым простым экспериментом был запуск Clio у него дома без предварительной уборки.

Команда составила список заданий на естественном языке, например «переместить кучу одежды». Затем они применили Clio к изображениям захламлённой квартиры Маджио. Clio смог быстро определить сегменты, составляющие кучу одежды.

Также команда запустила Clio на роботе Spot компании Boston Dynamic. Они дали роботу список задач, которые он должен был выполнить. Пока робот исследовал и наносил на карту внутренности офисного здания, Clio работал в режиме реального времени на бортовом компьютере робота. Метод генерировал наложенную карту с изображением целевых объектов, которую робот использовал для приближения к идентифицированным объектам и физического выполнения задания.

Команда гордится тем, что запустила Clio в режиме реального времени — это большое достижение для них. Раньше на выполнение работы уходило несколько часов.

В планах команды — улучшить Clio для более сложных задач и использовать последние достижения в области фотореалистичных визуальных представлений сцен.

Пока мы даём Clio простые задачи, например, «найти колоду карт». Для поисково-спасательных работ нужны более сложные задания, такие как „найти выживших“ или „восстановить электроснабжение“. Так мы хотим понять, как научить Clio выполнять сложные задачи на уровне человека, — заключает Мадджио.

30.09.2024

Подписаться: Телеграм | Дзен | Вконтакте


Хайтек

Маленькие, да удаленькие: технологии только выигрывают от уменьшения
Маленькие, да удаленькие: технологии только выигрывают от уменьшения

Миниатюризация представляет собой естественный

Найден способ перезаписывать данные без электричества
Найден способ перезаписывать данные без электричества

В 2023 году ученые из EPFL совершили прор...

Разработан адгезив, который адаптируется к любой поверхности
Разработан адгезив, который адаптируется к любой поверхности

Ученые из Университета Сиань Цзяотун созд...

Тоньше кожи: пленка в 10 нанометров изменит тепловизоры
Тоньше кожи: пленка в 10 нанометров изменит тепловизоры

Инженеры MIT придумали, как выращивать и&...

Нейросеть предсказывает ход химических реакций за секунду
Нейросеть предсказывает ход химических реакций за секунду

Химики знают: чтобы реакция пошла, нужен перех...

Разработан робот без батареек, обманывающий законы механики
Разработан робот без батареек, обманывающий законы механики

Инженеры Принстонского университета создали ма...

Ученые заглянули в работающий OLED неинвазивно
Ученые заглянули в работающий OLED неинвазивно

Высококачественные дисплеи в складных сма...

Ученые создали световые вихри с контролируемой структурой
Ученые создали световые вихри с контролируемой структурой

Профессор Харальд Гиссен и его коман...

Электричество под кожей: новый материал превратит ваше тепло в ток
Электричество под кожей: новый материал превратит ваше тепло в ток

Ученые из Квинслендского технологического...

Новый метод предсказывает стабильность кристаллических форм
Новый метод предсказывает стабильность кристаллических форм

Ученые придумали, как точнее рассчитывать...

Ученые улучшили катализатор для добычи водорода
Ученые улучшили катализатор для добычи водорода

Химики придумали новый способ улучшить материа...

Ученые изготовили самый точный мини-генератор терагерцовых волн
Ученые изготовили самый точный мини-генератор терагерцовых волн

Ученые из Университета Цинхуа создали ком...

NatComm: Электроны в антиферромагнетиках ведут себя не по правилам
NatComm: Электроны в антиферромагнетиках ведут себя не по правилам

Международная группа ученых из Токийского...

Ученые МИФИ создают цветной рентген — как он работает
Ученые МИФИ создают цветной рентген — как он работает

Команда молодых ученых из НИЯУ МИФИ ...

Цифровой клон нефтяного пласта: как ТПУ помогает добытчикам
Цифровой клон нефтяного пласта: как ТПУ помогает добытчикам

В Томском политехническом университете есть Це...

Не взлет — так посадка: как робопчела обрела ноги
Не взлет — так посадка: как робопчела обрела ноги

Робопчела от Гарварда уже давно умее...

Зерна проблем: как ИИ учится предсказывать слабые места металлов
Зерна проблем: как ИИ учится предсказывать слабые места металлов

Группа исследователей из Университета Лих...

Ловушка для слуха: как работает амбисоника
Ловушка для слуха: как работает амбисоника

Обычные объемные колонки погружают вас в&...

Не плазма, но близко: как ультразвук ищет изъяны в деталях ИТЭР
Не плазма, но близко: как ультразвук ищет изъяны в деталях ИТЭР

Ученые из Томского политеха создали новую...

Капля за каплей: создана новая модель для микрофлюидных чипов
Капля за каплей: создана новая модель для микрофлюидных чипов

Ученые из Пекинского технологического инс...

Ловцы молний: как ученые поймали убегающие электроны в лаборатории
Ловцы молний: как ученые поймали убегающие электроны в лаборатории

Ученые впервые поймали убегающие электроны&nbs...

Поиск на сайте

ТОП - Новости мира, инновации

Не все «зомби-клетки» одинаково опасны: ученые нашли способ их сортировать
Не все «зомби-клетки» одинаково опасны: ученые нашли способ их сортировать
Не еда, а биология: вот почему с годами жир копится именно на животе
Не еда, а биология: вот почему с годами жир копится именно на животе
Маленькие, да удаленькие: технологии только выигрывают от уменьшения
Маленькие, да удаленькие: технологии только выигрывают от уменьшения
Лекарства без брака: науке пора перестать мешать компоненты в блендере
Лекарства без брака: науке пора перестать мешать компоненты в блендере
Найден способ перезаписывать данные без электричества
Найден способ перезаписывать данные без электричества
ИИ помогает точнее выявлять насилие над детьми в больницах
ИИ помогает точнее выявлять насилие над детьми в больницах
Кто пожалеет обезьяну: неожиданная правда о шимпанзе и бонобо
Кто пожалеет обезьяну: неожиданная правда о шимпанзе и бонобо
Как люди пережили ледниковый период в Казахстане
Как люди пережили ледниковый период в Казахстане
Как пуповинная кровь помогает предсказать болезни ребенка
Как пуповинная кровь помогает предсказать болезни ребенка
Запутанность без шума: ученые нашли способ очистить квантовую связь
Запутанность без шума: ученые нашли способ очистить квантовую связь
Социальное обучение без розовых очков: как мы перенимаем чужой опыт
Социальное обучение без розовых очков: как мы перенимаем чужой опыт
Сладкая жизнь стволовых клеток: галактоза стала эликсиром молодости
Сладкая жизнь стволовых клеток: галактоза стала эликсиром молодости
Антибиотики в раннем детстве приводят к лишнему весу
Антибиотики в раннем детстве приводят к лишнему весу
Ученые выяснили, как малярия провоцирует рак у детей
Ученые выяснили, как малярия провоцирует рак у детей
Найдены 5 белков, которые кричат об опасности за 16 лет до катастрофы с печенью
Найдены 5 белков, которые кричат об опасности за 16 лет до катастрофы с печенью

Новости компаний, релизы

Крипта для людей: почему сложные сервисы теряют пользователей
«Точки роста» в действии: как школы Симферопольского района перестали быть скучными
На одной волне: университет и госструктура усиливают IT-суверенитет
Оперировать в VR: студенты придумали симулятор для хирургов
Не успеешь моргнуть — WhisperX уже расшифровал: тест скорости от Ainergy