Создан метод тонкой настройки модели ИИ на устройствах с ограниченными ресурсами

Персонализированные модели глубокого обучения позволяют создавать чат-боты с искусственным интеллектом, которые адаптируются к акценту пользователя, или интеллектуальные клавиатуры, которые постоянно обновляются, чтобы лучше предсказать следующее слово на основе истории набора текста.

Такая настройка требует постоянной доводки модели машинного обучения с учетом новых данных.

Поскольку смартфоны и другие периферийные устройства не обладают достаточной памятью и вычислительной мощностью, необходимые для такой тонкой настройки, данные пользователя обычно загружаются на облачные серверы, где происходит обновление модели. Однако передача данных потребляет большое количество энергии, а отправка конфиденциальных данных пользователя на облачный сервер представляет собой риск для безопасности.

Исследователи из Массачусетского технологического института, Лаборатории искусственного интеллекта MIT-IBM Watson и других организаций разработали методику, позволяющую моделям глубокого обучения эффективно адаптироваться к новым сенсорным данным непосредственно на периферийном устройстве.

Метод обучения на устройстве, получивший название PockEngine, определяет, какие части огромной модели машинного обучения необходимо обновить для повышения точности, и сохраняет и вычисляет только эти части. Основная часть этих вычислений выполняется в процессе подготовки модели, до времени выполнения, что минимизирует вычислительные затраты и повышает скорость процесса тонкой настройки.

По сравнению с другими методами PockEngine значительно ускорил процесс обучения на устройстве: на некоторых аппаратных платформах он выполнялся в 15 раз быстрее. При этом PockEngine не привел к снижению точности моделей. Исследователи также обнаружили, что их метод тонкой настройки позволил популярному чатботу с искусственным интеллектом более точно отвечать на сложные вопросы.

Тонкая настройка на устройстве может обеспечить лучшую конфиденциальность, снижение затрат, а также непрерывное обучение, но это нелегко. Все должно происходить при ограниченном количестве ресурсов. Мы хотим иметь возможность выполнять на устройстве не только вывод, но и обучение. С PockEngine это стало возможным, — говорит Сонг Хан (Song Han), доцент кафедры электротехники и вычислительной техники (EECS), член лаборатории MIT-IBM Watson AI Lab, видный ученый в NVIDIA и старший автор статьи, описывающей PockEngine.

Вместе с Ханом в работе над статьей участвует ведущий автор Лигенг Жу (Ligeng Zhu), аспирант EECS, а также другие сотрудники MIT, MIT-IBM Watson AI Lab и Калифорнийского университета в Сан-Диего. Работа была недавно представлена на Международном симпозиуме IEEE/ACM по микроархитектуре.

Слой за слоем

В основе моделей глубокого обучения лежат нейронные сети, состоящие из множества взаимосвязанных слоев узлов, или «нейронов», которые обрабатывают данные для составления прогноза. При запуске модели (этот процесс называется выводом) входные данные (например, изображение) передаются от слоя к слою, пока в конце не будет получено предсказание (возможно, метка изображения). В процессе вывода каждый слой после обработки входных данных больше не нуждается в хранении.

Однако при обучении и тонкой настройке модель проходит процесс, известный как обратное распространение (backpropagation). При обратном распространении выходной сигнал сравнивается с правильным ответом, а затем модель запускается в обратном направлении. Каждый слой обновляется по мере приближения выходных данных модели к правильному ответу.

Поскольку каждый слой может быть обновлен, необходимо хранить всю модель и промежуточные результаты, что делает тонкую настройку более требовательной к памяти.

Однако не все слои нейронной сети важны для повышения точности. И даже для тех слоев, которые важны, может не потребоваться обновление всего слоя. Эти слои и их фрагменты не нужно хранить. Более того, для повышения точности можно не возвращаться к первому слою — процесс может быть остановлен где-то посередине.

PockEngine использует эти факторы для ускорения процесса тонкой настройки и сокращения объема вычислений и памяти.

Сначала система производит тонкую настройку каждого слоя по очереди на определенной задаче и измеряет улучшение точности после каждого отдельного слоя. Таким образом, PockEngine определяет вклад каждого слоя, а также компромисс между точностью и стоимостью тонкой настройки и автоматически определяет процентное соотношение между слоями, требующими тонкой настройки.

Этот метод очень хорошо согласуется по точности с полным обратным распространением на разных задачах и разных нейронных сетях, — добавляет Хан.

Уменьшенная модель

Обычно граф обратного распространения генерируется во время выполнения программы, что требует значительных вычислений. Вместо этого PockEngine делает это во время компиляции, когда модель готовится к развертыванию.

PockEngine удаляет фрагменты кода, чтобы устранить ненужные слои или части слоев, создавая сокращенный граф модели, который будет использоваться во время выполнения. Затем он выполняет другие оптимизации этого графа для дальнейшего повышения эффективности.

Поскольку все это нужно сделать только один раз, это позволяет сэкономить на вычислительных затратах во время выполнения программы.

Это как перед тем, как отправиться в поход. Дома вы тщательно планируете, по каким тропам пойдете, какие тропы пропустите. И тогда во время выполнения задания, когда вы действительно идете в поход, у вас уже есть очень тщательный план, которому вы должны следовать, — объясняет Хан.

Когда PockEngine применили к моделям глубокого обучения на различных граничных устройствах, включая чипы Apple M1, цифровые сигнальные процессоры, используемые во многих смартфонах и компьютерах Raspberry Pi, он выполнял обучение на устройстве в 15 раз быстрее, без какого-либо снижения точности. PockEngine также значительно сократил объем памяти, необходимой для тонкой настройки.

Команда также применила эту методику к большой языковой модели Llama-V2. По словам Хана, при работе с большими языковыми моделями процесс тонкой настройки предполагает предоставление большого количества примеров, что очень важно для обучения модели взаимодействию с пользователем. Этот процесс также важен для моделей, которым предстоит решать сложные задачи или рассуждать о решениях.

Например, модели Llama-V2, прошедшие тонкую настройку с помощью PockEngine, правильно ответили на вопрос «Какой был последний альбом Майкла Джексона?», в то время как модели без тонкой настройки не справились. На платформе NVIDIA Jetson Orin, работающей на граничных GPU, PockEngine сократил время, затрачиваемое на каждую итерацию процесса тонкой настройки, с примерно семи секунд до менее чем одной секунды.

16.11.2023


Подписаться в Telegram



Net&IT

Nature Electronics: Изменение памяти дает новые вычислительные возможности
Nature Electronics: Изменение памяти дает новые вычислительные возможности

Ученые Рочестерского университета разработали ...

Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта
Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта

Многофункциональные компьютерные чипы эволюцио...

Началась регистрация на конкурс «Битва искусственных интеллектов»
Началась регистрация на конкурс «Битва искусственных интеллектов»

Стартовал отборочный этап Международного техно...

ИИ помогает математикам находить закономерности
ИИ помогает математикам находить закономерности

Применение машинного обучения для поиска ...

Scientific Reports: Борьба с недоверием в Интернете может быть неэффективной
Scientific Reports: Борьба с недоверием в Интернете может быть неэффективной

Новое исследование, проведенное Университетом ...

JRCS: ChatGPT перегружает пользователей выбором
JRCS: ChatGPT перегружает пользователей выбором

За последние несколько лет в области...

Искусственный интеллект может превзойти человеческий мозг
Искусственный интеллект может превзойти человеческий мозг

Ощупывание кошачьей шерсти может дать некотору...

Нейронные сети в опасности: как злоумышленники могут запутать ИИ
Нейронные сети в опасности: как злоумышленники могут запутать ИИ

Большинство искусственных интеллектуальных сис...

ChatGPT почти такой же хороший диагност, как доктор Хаус
ChatGPT почти такой же хороший диагност, как доктор Хаус

Чат-бот с искусственным интеллектом ChatG...

QS&T: Ученые создали самый точный метод управления квантовыми компьютерами
QS&T: Ученые создали самый точный метод управления квантовыми компьютерами

С помощью лазерного излучения исследователи ра...

New Phytologist: ИИ поможет распознавать аллергенную пыльцу
New Phytologist: ИИ поможет распознавать аллергенную пыльцу

Новая система, сочетающая в себе быстрое ...

Российские игры покоряют мир: Atomic Heart заняла первое место на Steam
Российские игры покоряют мир: Atomic Heart заняла первое место на Steam

В этом году российская игровая индустрия продо...

HV&I: ChatGPT помогает выявлять фейки о вакцинации
HV&I: ChatGPT помогает выявлять фейки о вакцинации

Чат-бот ChatGPT может помочь увеличить количес...

Те, у кого нет AR-очков, уязвимы перед теми, у кого они есть
Те, у кого нет AR-очков, уязвимы перед теми, у кого они есть

Тот, кто носит очки дополненной реальност...

Nature: Научная группа разработала критерии определения сознания ИИ
Nature: Научная группа разработала критерии определения сознания ИИ

В этом может помочь контрольный список, состав...

JAMA Oncology: ChatGPT еще не готов заменить врачей-онкологов
JAMA Oncology: ChatGPT еще не готов заменить врачей-онкологов

Когда исследователи попросили чатбот назначить...

Computers in Human Behavior: Социальные сети не провоцируют депрессию у детей
Computers in Human Behavior: Социальные сети не провоцируют депрессию у детей

Дети действительно проводят много времени в&nb...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Nature Geoscience: Ученые возвестили начало лунного антропоцена
Nature Geoscience: Ученые возвестили начало лунного антропоцена
NeuroImage: Найдено объяснение разного уровня эритроцитов в крови новорожденных
NeuroImage: Найдено объяснение разного уровня эритроцитов в крови новорожденных
PLOS ONE: Разработана система для предотвращения потери природных ресурсов
PLOS ONE: Разработана система для предотвращения потери природных ресурсов
Хирургия полезна для некоторых детей с легким нарушением дыхания во сне
Хирургия полезна для некоторых детей с легким нарушением дыхания во сне
PLOS ONE: Сойки и вороны по-разному реагируют на появление конкурентов
PLOS ONE: Сойки и вороны по-разному реагируют на появление конкурентов
Исследователи составили карту воздействия кетамина на мозг
Исследователи составили карту воздействия кетамина на мозг
Мозг новорожденных только кажется недоразвитым по сравнению с другими приматами
Мозг новорожденных только кажется недоразвитым по сравнению с другими приматами
PNAS: Есть ли признаки жизни на холодной луне Сатурна?
PNAS: Есть ли признаки жизни на холодной луне Сатурна?
Исследование показало, как важный белок сбалансировал клеточные мембраны
Исследование показало, как важный белок сбалансировал клеточные мембраны
AJT: Старые органы ускоряют старение получателей трансплантатов
AJT: Старые органы ускоряют старение получателей трансплантатов
Ученые предложили собирать воду из воздуха с помощью солнечной энергии
Ученые предложили собирать воду из воздуха с помощью солнечной энергии
В Science Advances опубликовали новые сведения о гибели динозавров
В Science Advances опубликовали новые сведения о гибели динозавров
JI: В-клетки вырабатывают антитела, которые подавляют аутоиммунный патогенез
JI: В-клетки вырабатывают антитела, которые подавляют аутоиммунный патогенез
Nature Comm: Робот, созданный по образу улитки, соберет микропластик в океане
Nature Comm: Робот, созданный по образу улитки, соберет микропластик в океане
Соленые иммунные клетки в мозге связаны с деменцией, вызванной гипертонией
Соленые иммунные клетки в мозге связаны с деменцией, вызванной гипертонией

Новости компаний, релизы

НАИРИТ объявит итоги Всероссийского инновационного конкурса 21 февраля
НАИРИТ объявит итоги Всероссийского инновационного конкурса 21 февраля
«Инструменты инновационного развития»
«Инструменты инновационного развития»
3 причины перехода с печатной рекламы на цифровую
3 причины перехода с печатной рекламы на цифровую
Виды резервирования серверов для задач АСУ ТП
Виды резервирования серверов для задач АСУ ТП
Выбор клиники и лечащего врача с помощью специализированного сервиса
Выбор клиники и лечащего врача с помощью специализированного сервиса