Осязание не главное: неожиданный секрет обучения роборуки
Как роботизированная рука или протез учатся сложным движениям, например, удерживать и вращать мяч?
Главная проблема для человека или машины — научиться точно управлять пальцами, чтобы правильно прикладывать силу к предмету. Раньше считалось, что без тактильных датчиков, имитирующих чувствительную кожу и нервные окончания человеческой руки, робот не сможет освоить такие навыки. Но если люди могут манипулировать предметами даже в перчатках, значит, дело не только в осязании.
Исследователи из лаборатории ValeroLab (Университет Южной Калифорнии) решили проверить, действительно ли тактильная обратная связь всегда необходима для обучения. Они задались вопросом: что важнее — «врожденные» свойства руки (например, датчики) или „приобретенные“ навыки, которые развиваются во время тренировки?
В статье журнала Science Advances команда использовала компьютерное моделирование и машинное обучение, чтобы показать: ключевую роль играет не столько осязание, сколько последовательность обучения — так называемый «учебный план». Оказалось, что если правильно подобрать этапы тренировки, даже виртуальная рука с неполными или отсутствующими тактильными данными научится управлять объектами.
Для эксперимента смоделировали трехпалую роборуку и обучали ее поднимать и вращать предмет.
Что выяснилось:
- Тактильная информация не всегда критична — можно обойтись без нее.
- Гораздо важнее, как именно идет обучение: если система получает «награду» за правильные действия в нужном порядке, она быстрее адаптируется.
Награда направляет развитие системы, — объясняет Франсиско Валеро-Куэвас, руководитель исследования.
Так же, как и в живой природе: опыт формирует навыки. Эта связь между биологией и машинным обучением поможет создавать ИИ, который лучше приспосабливается к реальному миру.
Ромина Мир, соавтор работы, добавляет:
Мы доказали, что продуманная программа тренировок может компенсировать даже недостаток сенсоров.
Этот эксперимент меняет подход к проектированию роботов и протезов. Раньше инженеры стремились оснастить их максимально точными сенсорами, что удорожало и усложняло системы. Теперь ясно: можно добиться похожих результатов через оптимальные алгоритмы обучения.
Где пригодится:
- Протезирование — дешевые протезы с базовыми датчиками смогут работать лучше, если их «обучать» по правильной методике.
- Робототехника — не нужно ждать идеальных тактильных технологий, чтобы создавать функциональные манипуляторы.
- ИИ — принципы постепенного обучения помогут нейросетям быстрее осваивать физические задачи.
Ранее ученые усовершенствовали робота-художника.