Nature: Созданные ИИ тексты будут размечаться водяными знаками

Исследователи из лондонской лаборатории Google DeepMind создали способ помечать текст, созданный искусственным интеллектом. Водяной знак распространили среди пользователей чат-ботов.

Ученые создали водяной знак, о котором сообщается в журнале Nature. Он не первый среди созданных для текста, сгенерированного искусственным интеллектом, и не способен противостоять настойчивым попыткам удалить его. Но это первая масштабная демонстрация водяного знака в реальном мире.

Скотт Ааронсон, специалист по информатике из Техасского университета в Остине, считает самым важным то, что систему действительно развернули. До августа он работал над водяными знаками в OpenAI — компании, создавшей ChatGPT.

Определение текстов, созданных с помощью искусственного интеллекта, становится все более важным. Это поможет решить проблемы фальшивых новостей и академического списывания. Также это позволит избежать ухудшения качества будущих моделей, если их обучать на контенте, созданном ИИ.

В ходе эксперимента пользователи большой языковой модели Gemini от Google оценили 20 миллионов ответов. Они не заметили разницы в качестве между текстами с водяными знаками и без них.

Фуронг Хуанг, специалист по информатике из Мэрилендского университета, рад, что Google сделала этот шаг навстречу технологическому сообществу. Захар Шумайлов, ученый-компьютерщик из Кембриджского университета (Великобритания), считает, что в ближайшем будущем большинство коммерческих инструментов будут снабжены подобными водяными знаками.

Выбор слов

Поставить водяной знак на текст сложнее, чем на изображение. В случае с текстом можно изменить только одно — сами слова.

Водяной знак DeepMind под названием SynthID-Text изменяет слова, которые выбирает модель, особым образом. Этот способ можно обнаружить с помощью криптографического ключа.

По сравнению с другими подходами, водяной знак DeepMind легче обнаружить, но его применение не замедляет генерацию текста. По словам Шумайлова, бывшего соавтора и брата одного из авторов исследования, этот метод превосходит схемы конкурентов по нанесению водяных знаков на LLM.

Инструмент стал открытым, чтобы разработчики могли добавлять на свои модели водяные знаки. Пушмит Кохли из DeepMind надеется, что другие разработчики подхватят эту идею. Google держит ключ в секрете, поэтому пользователи не смогут обнаружить водяные знаки Gemini с помощью инструментов обнаружения.

Власти считают водяные знаки действенным способом борьбы с распространением текста, созданного искусственным интеллектом. Но есть проблема: сложно обязать разработчиков использовать водяные знаки и согласовать их подходы. Исследователи из Швейцарского федерального технологического института в Цюрихе доказали, что любой водяной знак можно удалить или подделать, чтобы создать впечатление, будто текст сгенерирован ИИ.

Токен-турнир

DeepMind использует метод, который включает добавление водяного знака в алгоритм выборки. Это шаг в генерации текста, отдельный от основного алгоритма.

LLM — это сеть ассоциаций, обученная на миллиардах слов и частей слов (лексем). Получив строку текста, модель оценивает вероятность каждой лексемы из своего словаря быть следующей в предложении. Алгоритм выборки выбирает лексему в соответствии с набором правил.

Алгоритм SynthID-Text использует криптографический ключ для присвоения баллов токенам. Токены-кандидаты выбираются из распределения в зависимости от их вероятности и помещаются в «турнир». В турнире алгоритм сравнивает баллы, и побеждает тот, у кого больше баллов. Процесс продолжается до тех пор, пока не останется один токен, который будет выбран для использования в тексте.

Эта схема усложняет обнаружение водяного знака, так как нужно прогнать криптографический код по тексту, чтобы найти высокие оценки, указывающие на «выигрышные» токены. Это также затрудняет удаление водяного знака.

Раунды турнира можно сравнить с комбинированным замком, в котором каждый раунд — это отдельная цифра, необходимая для его разблокировки.

Этот механизм усложняет задачу по удалению водяного знака, — говорит Хуанг.

Авторы показали, что водяной знак можно обнаружить при работе с текстом из 200 лексем, даже если использовать второй LLM для перефразирования текста. Для более коротких строк текста водяной знак менее устойчив.

Исследователи не изучали, насколько хорошо водяной знак может противостоять попыткам удаления.

Устойчивость водяных знаков к таким атакам важна для безопасности ИИ, — говорит ученый-компьютерщик Ив-Александр-де Монтжойе из Имперского колледжа Лондона.

Кохли надеется, что водяной знак будет полезен при использовании LLM.

Мы хотели создать инструмент, который сообщество сможет улучшить, — заключает он.

28.10.2024


Подписаться в Telegram



Net&IT

ИИ знает, кем ты станешь: как соцсети помогают выбрать профессию
ИИ знает, кем ты станешь: как соцсети помогают выбрать профессию

Ученые из Санкт-Петербургского государств...

Риски квантовой эры: как защитить интернет от новых угроз
Риски квантовой эры: как защитить интернет от новых угроз

Квантовые вычисления больше не являются д...

Представлены новейшие разработки в области квантовых вычислений
Представлены новейшие разработки в области квантовых вычислений

Квантовые вычисления находятся в авангард...

TheInnovator: Роботы с искусственным интеллектом изменят рынок труда
TheInnovator: Роботы с искусственным интеллектом изменят рынок труда

Если компании и ИИ-стартапы, стремящиеся ...

В КАИ оснащают беспилотники компьютерным зрением
В КАИ оснащают беспилотники компьютерным зрением

Ученые университета разработали специальные пр...

Разработан реалистичный тест для оценки навыков клинического общения ИИ
Разработан реалистичный тест для оценки навыков клинического общения ИИ

Инструменты искусственного интеллекта, такие к...

Сети Wi-Fi-избавили от лишней «информационной нагрузки»
Сети Wi-Fi-избавили от лишней «информационной нагрузки»

Ученые придумали, как сделать информацию ...

Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения

Системы искусственного интеллекта склонны пере...

Новую модель для графической нейросети сделают доступной для смартфонов
Новую модель для графической нейросети сделают доступной для смартфонов

Среди множества моделей искусственного интелле...

В ННГУ научились восстанавливать функции биологических нейросетей
В ННГУ научились восстанавливать функции биологических нейросетей

Новую технологию, которая работает подобно кле...

Scientific Reports: Разработано подвижное навигационное устройство для незрячих
Scientific Reports: Разработано подвижное навигационное устройство для незрячих

Новаторская навигационная технология, использу...

Nature Communications: Аналоговые машины тоже могут обучаться
Nature Communications: Аналоговые машины тоже могут обучаться

Все думают, что машинное обучение &m...

Nature Communications: ИИ изучает язык расположения атомов в твердых телах
Nature Communications: ИИ изучает язык расположения атомов в твердых телах

Новую модель искусственного интеллекта, котора...

Science: Создана революционная технология, которая переписывает ДНК
Science: Создана революционная технология, которая переписывает ДНК

Брайан Хи руководит Лабораторией эволюцио...

Мемристоры сделают компьютеры будущего умными, как мозг
Мемристоры сделают компьютеры будущего умными, как мозг

Новое вещество для изменения работы устро...

В МФТИ создали бота для распознавания нот
В МФТИ создали бота для распознавания нот

Студенты МФТИ создали программу под назва...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

От лаборатории к реальности: как кристаллы времени заряжают мир
От лаборатории к реальности: как кристаллы времени заряжают мир
Ферменты против похмелья: как новый сенсор изменит медицину и не только
Ферменты против похмелья: как новый сенсор изменит медицину и не только
Сок под микроскопом: ученые научились ловить опасный гербицид за 20 минут
Сок под микроскопом: ученые научились ловить опасный гербицид за 20 минут
Молодые ученые против COVID-19 и хронических ран: как открытия изменят медицину
Молодые ученые против COVID-19 и хронических ран: как открытия изменят медицину
От Nokia к микросхемам: как Тампере снова сделает Финляндию великой
От Nokia к микросхемам: как Тампере снова сделает Финляндию великой
Энергия будущего: низкотемпературная плазма и ее невероятные возможности
Энергия будущего: низкотемпературная плазма и ее невероятные возможности
Питомниковый кашель больше не проблема: появились быстрые тесты для собак
Питомниковый кашель больше не проблема: появились быстрые тесты для собак
10 секунд до чистоты: история устройства, которое изменило дезинфекцию
10 секунд до чистоты: история устройства, которое изменило дезинфекцию
Сорняк-разрушитель или лекарство будущего: ученые открыли секрет рейнутрии
Сорняк-разрушитель или лекарство будущего: ученые открыли секрет рейнутрии
CARMA II — автономный робот, который делает ядерные объекты безопаснее
CARMA II — автономный робот, который делает ядерные объекты безопаснее
От идеи до Росатома: история успеха проекта RSP
От идеи до Росатома: история успеха проекта RSP
Витамины для коров и быки весом в тонну: прорыв от СПбГУВМ
Витамины для коров и быки весом в тонну: прорыв от СПбГУВМ
Ибогаин 2.0: ученые создают новое поколение лекарств от депрессии и зависимости
Ибогаин 2.0: ученые создают новое поколение лекарств от депрессии и зависимости
Ученые выяснили, что больше влияет на цену на жилье — вид из окна или площадь
Ученые выяснили, что больше влияет на цену на жилье — вид из окна или площадь
Небо в опасности: космический мусор угрожает авиации
Небо в опасности: космический мусор угрожает авиации

Новости компаний, релизы

Школьников и студентов Хабаровского края приглашают написать всероссийский диктант «Наука во имя Победы»
Три представительницы Республики Татарстан стали победителями Всероссийского конкурса Знание.Лектор
Калужан приглашают к участию в XIII сезоне Международного инженерного чемпионата CASE-IN
В Калуге обсудили меры поддержки молодых учёных региона
Молодых и заслуженных ученых наградили в Хабаровске