Nature Communications: Аналоговые машины тоже могут обучаться
Все думают, что машинное обучение — это полностью цифровое явление, ставшее возможным благодаря компьютерам и алгоритмам, которые могут имитировать поведение, подобное поведению мозга. Но первые машины были аналоговыми, и сейчас небольшой, но растущий объем исследований показывает, что механические системы тоже способны к обучению.

Физики из Мичиганского университета представили новейшую работу в этой области.
Команда Шуайфенга Ли и Сяомина Мао из Университета Мичигана разработала алгоритм, который обеспечивает математическую основу для того, как происходит обучение в решетках, называемых механическими нейронными сетями.
«Материалы могут самостоятельно обучаться задачам и выполнять вычисления», — говорит Ли.
Исследователи показали, как этот алгоритм может быть использован для «обучения» материалов решению задач, таких как идентификация различных видов растений ирисов. В один прекрасный день эти материалы смогут создавать структуры, способные решать более сложные задачи — например, крылья самолетов, которые будут оптимизировать свою форму для различных условий ветра — без участия человека или компьютера.
По словам Ли, постдоктора-исследователя, это будущее еще далеко, но результаты нового исследования U-M могут вдохновить исследователей за пределами этой области уже сейчас.
Алгоритм основан на подходе под названием «обратное распространение», который использовался для обучения цифровых и оптических систем. По словам исследователей, из-за очевидного безразличия алгоритма к тому, как переносится информация, он может помочь открыть новые пути для изучения того, как живые системы обучаются.
«Мы видим, что теория обратного распространения успешно применяется во многих физических системах», — говорит Ли. „Я думаю, это также может помочь биологам понять, как работают биологические нейронные сети у людей и других видов“.
Ли и Мао, профессор кафедры физики Университета штата Массачусетс, опубликовали новое исследование в журнале Nature Communications.
MNNs 101
Идея использования физических объектов в вычислениях существует уже несколько десятилетий. Но внимание к механическим нейронным сетям появилось недавно, и интерес к ним растет вместе с другими недавними достижениями в области искусственного интеллекта.
Большинство этих достижений — и, конечно, самые заметные — относятся к сфере компьютерных технологий. Сотни миллионов людей еженедельно обращаются к чат-ботам на базе искусственного интеллекта, таким как ChatGPT, за помощью в написании электронных писем, планировании отпуска и т. д.
В основе этих ИИ-помощников лежат искусственные нейронные сети. Хотя их работа сложна и в значительной степени скрыта от глаз, они представляют собой полезную аналогию для понимания механических нейронных сетей, говорит Ли.
При использовании чат-бота пользователь вводит команду или вопрос, которые интерпретируются алгоритмом нейронной сети, работающей на компьютере с огромной вычислительной мощностью. Основываясь на том, что эта система узнала в результате воздействия огромного количества данных, она генерирует ответ, или вывод, который появляется на экране пользователя.
Механическая нейронная сеть, или МНС, имеет те же основные элементы. В исследовании Ли и Мао входными данными был вес, прикрепленный к материалу, который выступал в качестве системы обработки. На выходе получалось, как материал меняет свою форму под действием веса.
«Сила — это входящая информация, сам материал — как процессор, а деформация материала — это выход или реакция», — говорит Ли.
В данном исследовании «процессорными» материалами были резиновые 3D-печатные решетки, состоящие из крошечных треугольников, которые образовывали более крупные трапеции. Материалы обучаются, регулируя жесткость или гибкость определенных сегментов внутри этой решетки.
Чтобы реализовать их футуристическое применение, как, например, крылья самолетов, которые настраивают свои свойства на лету, МНН должны быть способны самостоятельно регулировать эти сегменты. Материалы, которые могут это делать, уже изучаются, но пока их нельзя заказать по каталогу.
Поэтому Ли смоделировал это поведение, распечатав новые версии процессора с более толстым или тонким сегментом, чтобы получить желаемый отклик. Главный вклад Ли и Мао в работу — алгоритм, который инструктирует материал о том, как адаптировать эти сегменты.
Как обучить MNN
Хотя математика, лежащая в основе теории обратного распространения, сложна, сама идея интуитивно понятна, говорит Ли.
Чтобы начать процесс обучения, необходимо знать, какие входные данные вам нужны и как система должна на них реагировать. Затем вы применяете входные данные и смотрите, насколько фактический ответ отличается от желаемого. Затем сеть воспринимает эту разницу и использует ее для определения того, как она изменяет себя, чтобы приблизиться к желаемому результату в ходе последующих итераций.
С математической точки зрения, разница между реальным и желаемым выходом соответствует выражению, называемому функцией потерь. Именно применяя математический оператор, известный как градиент, к этой функции потерь, сеть учится меняться.
Ли показал, что если вы знаете, что искать, то его MNN предоставляют эту информацию.
«Он может показать градиент автоматически», — сказал Ли, добавив, что в этом исследовании ему помогли камеры и компьютерный код. „Это очень удобно и очень эффективно“.
Рассмотрим случай, когда решетка полностью состоит из сегментов одинаковой толщины и жесткости. Если подвесить груз к центральному узлу — точке пересечения сегментов, — то соседние узлы слева и справа будут двигаться вниз одинаково, поскольку система симметрична.
Но предположим, что вместо этого вы хотите создать решетку, которая давала бы не просто асимметричный, а максимально асимметричный отклик. То есть вы хотите создать сеть, которая дает максимальную разницу в движении между узлом слева от веса и узлом справа от него.
Ли и Мао использовали свой алгоритм и простую экспериментальную установку для создания решетки, которая дает такое решение. (Еще одно сходство с биологией заключается в том, что этот подход заботится только о том, что делают близлежащие связи, подобно тому, как работают нейроны, сказал Ли).
Пойдя еще дальше, исследователи также предоставили большие наборы данных входных воздействий, подобно тому, как это делается в машинном обучении на компьютерах, чтобы обучить свои MNN.
В одном из примеров разные входные силы соответствовали разным размерам лепестков и листьев на растениях ириса, которые являются определяющими признаками, помогающими различать виды. Затем Ли может представить обученной решетке растение неизвестного вида, и она сможет правильно его отсортировать.
Ли уже работает над повышением сложности системы и над проблемами, которые она может решать, используя MNN, передающие звуковые волны.
«Мы можем закодировать гораздо больше информации на входе», — говорит Ли. „В звуковых волнах есть амплитуда, частота и фаза, которые могут кодировать данные“.
В то же время команда U-M изучает более широкие классы сетей в материалах, включая полимеры и сборки наночастиц. С их помощью они смогут создать новые системы, в которых смогут применить свой алгоритм и работать над созданием полностью автономных самообучающихся машин.
Ранее ученые запустили искусственный интеллект на квантовом устройстве.



















