IEEE Access: Ученые улучшили модели автоматической обрезки изображений

01.08.2024898

Обрезка изображений — важная задача в разных областях: от социальных сетей и электронной коммерции до компьютерного зрения.

IEEE Access: Ученые улучшили модели автоматической обрезки изображений

Обрезка помогает сохранить качество изображения, не меняя его размер и не расходуя вычислительные ресурсы. Она также полезна, когда изображение должно соответствовать определённому соотношению сторон (например, в миниатюрах).

За последние десять лет инженеры разработали различные модели машинного обучения для автоматической обрезки изображений. Эти модели сохраняют наиболее важные части входного изображения.

Модели машинного обучения могут ошибаться и быть необъективными, что иногда приводит пользователей к юридическим проблемам. Например, в 2020 году компания X (бывший Twitter) получила иск из-за того, что её функция автоматического кадрирования скрыла информацию об авторских правах на изображении. Чтобы избежать подобных проблем, нужно понять, почему модели машинного обучения для обрезки изображений работают неудачно.

Исследователи из Университета Дошиша (Япония) разработали новые методы создания сложных примеров для задачи обрезки изображений. Они вносят незаметные искажения в изображение, чтобы обмануть модель и заставить её обрезать нужные области, даже если изначально она этого не планировала.

Докторант Масатомо Йошида, ведущий исследователь, объясняет мотивацию работы так:

Нужно доработать модели обрезки изображений, чтобы они учитывали намерения пользователей и были беспристрастными.

В исследовании участвовали Масатомо Йошида и Харуто Намура из Высшей школы науки и техники Университета Дошиша (Киото, Япония), а также Масахиро Окуда с факультета науки и техники того же университета.

Исследователи разработали два подхода для создания негативных примеров: «белый ящик» и „чёрный ящик“.

  • Метод «белого ящика» требует доступа к внутренним механизмам целевой модели. Он предполагает итеративный расчёт возмущений входных изображений на основе градиентов модели. Этот подход использует модель предсказания взгляда, чтобы определить ключевые точки на изображении и затем манипулирует ими. В результате размер возмущений уменьшается на 62,5% по сравнению с базовыми методами на экспериментальном наборе данных изображений.
  • Подход «чёрного ящика» использует байесовскую оптимизацию, чтобы эффективно сузить пространство поиска и сосредоточиться на определённых областях изображения. Как и подход „белого ящика“, он включает повторяющиеся процедуры, основанные на картах салиентности взгляда. Вместо внутренних градиентов используется древовидный оценщик Парзена для выбора и оптимизации координат пикселей, влияющих на солёность взгляда. Это позволяет получить нужные изображения.

Методы «чёрного ящика» более применимы в реальных ситуациях и важны для кибербезопасности.

Аспирант Харуто Намура, один из участников исследования, рассказал, что оба подхода дают хорошие результаты.

Наши методы лучше существующих и могут эффективно применяться на практике, например, в Twitter.

Это исследование — шаг вперёд в создании надёжных систем искусственного интеллекта. Оно важно для доверия общества к таким системам.

Повышение эффективности генерации состязательных примеров для обрезки изображений поможет исследованиям в области ИИ и решению насущных проблем.

По словам профессора Масахиро Окуда, исследование выявляет уязвимые места в моделях ИИ и способствует созданию более справедливых систем.

Результаты опубликованы в издании IEEE Access.

Подписаться: Телеграм | Дзен | Вконтакте


Net&IT

Почему нейросети до сих пор не понимают, что творят
Почему нейросети до сих пор не понимают, что творят

Триллионы параметров, миллиарды вычислений&nbs...

Российские ИИ и 3D-принтеры победили на конкурсе БРИКС
Российские ИИ и 3D-принтеры победили на конкурсе БРИКС

Российские стартапы доказали, что могут к...

Ученые СПбГУ упростили расчеты для стабильной связи
Ученые СПбГУ упростили расчеты для стабильной связи

Представьте, что ваш телефон внезапн...

Невидимый хвост: почему чистка куки не спасает от слежки
Невидимый хвост: почему чистка куки не спасает от слежки

Вы чистите куки и думаете, что тепер...

Ученые изобрели способ записывать информацию во льду
Ученые изобрели способ записывать информацию во льду

Вместо облачных технологий — ледяны...

Чем рискуют ученые, доверяя ИИ свои статьи
Чем рискуют ученые, доверяя ИИ свои статьи

Ошибка алгоритма может стоить исследователю ре...

От 5G до квантов: как сети учатся выживать в мире перегрузок
От 5G до квантов: как сети учатся выживать в мире перегрузок

Иногда один оборванный кабель оставляет целую ...

Ученые нашли способ уменьшить нейросети без потери качества
Ученые нашли способ уменьшить нейросети без потери качества

Глубокое обучение напоминает бардак в шка...

Новый чип ускоряет обработку сигналов в 100 раз
Новый чип ускоряет обработку сигналов в 100 раз

Обычный ИИ тратит на анализ сигналов...

Ученые создали идеальный генератор чисел
Ученые создали идеальный генератор чисел

Что, если случайность — не&nbs

Надежно как в ДНК: когда данные начнут жить тысячелетиями
Надежно как в ДНК: когда данные начнут жить тысячелетиями

Жесткие диски выходят из строя а мол...

ИИ помогает неопытным таксистам работать наравне с профи
ИИ помогает неопытным таксистам работать наравне с профи

Таксисты в Японии случайно доказали, что&...

Как ИИ меняет бизнес и творческие профессии
Как ИИ меняет бизнес и творческие профессии

Споры о том, заменит ли ИИ люде...

Успешно испытан ИИ для диагностики кожных заболеваний
Успешно испытан ИИ для диагностики кожных заболеваний

Представьте инструмент, который замечает рак&n...

Поиск на сайте

ТОП - Новости мира, инновации

Новости компаний, релизы

ITPOD обновил номенклатуру серверов — разбираем обозначения
Автономные дроны без веб-интерфейса: просто API и никаких сложностей
Стажировка на Казанском вертолетном заводе – как студенты осваивали авиастроение
Как Самолет ускорил работу девелоперов в 7 раз
Как учат инноваторов: новый подход Московского Политеха