IEEE Access: Ученые улучшили модели автоматической обрезки изображений

Обрезка изображений — важная задача в разных областях: от социальных сетей и электронной коммерции до компьютерного зрения.

Обрезка помогает сохранить качество изображения, не меняя его размер и не расходуя вычислительные ресурсы. Она также полезна, когда изображение должно соответствовать определённому соотношению сторон (например, в миниатюрах).

За последние десять лет инженеры разработали различные модели машинного обучения для автоматической обрезки изображений. Эти модели сохраняют наиболее важные части входного изображения.

Модели машинного обучения могут ошибаться и быть необъективными, что иногда приводит пользователей к юридическим проблемам. Например, в 2020 году компания X (бывший Twitter) получила иск из-за того, что её функция автоматического кадрирования скрыла информацию об авторских правах на изображении. Чтобы избежать подобных проблем, нужно понять, почему модели машинного обучения для обрезки изображений работают неудачно.

Исследователи из Университета Дошиша (Япония) разработали новые методы создания сложных примеров для задачи обрезки изображений. Они вносят незаметные искажения в изображение, чтобы обмануть модель и заставить её обрезать нужные области, даже если изначально она этого не планировала.

Докторант Масатомо Йошида, ведущий исследователь, объясняет мотивацию работы так:

Нужно доработать модели обрезки изображений, чтобы они учитывали намерения пользователей и были беспристрастными.

В исследовании участвовали Масатомо Йошида и Харуто Намура из Высшей школы науки и техники Университета Дошиша (Киото, Япония), а также Масахиро Окуда с факультета науки и техники того же университета.

Исследователи разработали два подхода для создания негативных примеров: «белый ящик» и „чёрный ящик“.

  • Метод «белого ящика» требует доступа к внутренним механизмам целевой модели. Он предполагает итеративный расчёт возмущений входных изображений на основе градиентов модели. Этот подход использует модель предсказания взгляда, чтобы определить ключевые точки на изображении и затем манипулирует ими. В результате размер возмущений уменьшается на 62,5% по сравнению с базовыми методами на экспериментальном наборе данных изображений.
  • Подход «чёрного ящика» использует байесовскую оптимизацию, чтобы эффективно сузить пространство поиска и сосредоточиться на определённых областях изображения. Как и подход „белого ящика“, он включает повторяющиеся процедуры, основанные на картах салиентности взгляда. Вместо внутренних градиентов используется древовидный оценщик Парзена для выбора и оптимизации координат пикселей, влияющих на солёность взгляда. Это позволяет получить нужные изображения.

Методы «чёрного ящика» более применимы в реальных ситуациях и важны для кибербезопасности.

Аспирант Харуто Намура, один из участников исследования, рассказал, что оба подхода дают хорошие результаты.

Наши методы лучше существующих и могут эффективно применяться на практике, например, в Twitter.

Это исследование — шаг вперёд в создании надёжных систем искусственного интеллекта. Оно важно для доверия общества к таким системам.

Повышение эффективности генерации состязательных примеров для обрезки изображений поможет исследованиям в области ИИ и решению насущных проблем.

По словам профессора Масахиро Окуда, исследование выявляет уязвимые места в моделях ИИ и способствует созданию более справедливых систем.

Результаты опубликованы в издании IEEE Access.

01.08.2024


Подписаться в Telegram



Net&IT

Представлены новейшие разработки в области квантовых вычислений
Представлены новейшие разработки в области квантовых вычислений

Квантовые вычисления находятся в авангард...

TheInnovator: Роботы с искусственным интеллектом изменят рынок труда
TheInnovator: Роботы с искусственным интеллектом изменят рынок труда

Если компании и ИИ-стартапы, стремящиеся ...

В КАИ оснащают беспилотники компьютерным зрением
В КАИ оснащают беспилотники компьютерным зрением

Ученые университета разработали специальные пр...

Разработан реалистичный тест для оценки навыков клинического общения ИИ
Разработан реалистичный тест для оценки навыков клинического общения ИИ

Инструменты искусственного интеллекта, такие к...

Сети Wi-Fi-избавили от лишней «информационной нагрузки»
Сети Wi-Fi-избавили от лишней «информационной нагрузки»

Ученые придумали, как сделать информацию ...

Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения
Nature Human Behaviour: Заблуждение ИИ усиливает наши собственные заблуждения

Системы искусственного интеллекта склонны пере...

Новую модель для графической нейросети сделают доступной для смартфонов
Новую модель для графической нейросети сделают доступной для смартфонов

Среди множества моделей искусственного интелле...

В ННГУ научились восстанавливать функции биологических нейросетей
В ННГУ научились восстанавливать функции биологических нейросетей

Новую технологию, которая работает подобно кле...

Scientific Reports: Разработано подвижное навигационное устройство для незрячих
Scientific Reports: Разработано подвижное навигационное устройство для незрячих

Новаторская навигационная технология, использу...

Nature Communications: Аналоговые машины тоже могут обучаться
Nature Communications: Аналоговые машины тоже могут обучаться

Все думают, что машинное обучение &m...

Nature Communications: ИИ изучает язык расположения атомов в твердых телах
Nature Communications: ИИ изучает язык расположения атомов в твердых телах

Новую модель искусственного интеллекта, котора...

Science: Создана революционная технология, которая переписывает ДНК
Science: Создана революционная технология, которая переписывает ДНК

Брайан Хи руководит Лабораторией эволюцио...

Мемристоры сделают компьютеры будущего умными, как мозг
Мемристоры сделают компьютеры будущего умными, как мозг

Новое вещество для изменения работы устро...

В МФТИ создали бота для распознавания нот
В МФТИ создали бота для распознавания нот

Студенты МФТИ создали программу под назва...

Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса
Plant Phenomics: Как технологии помогают фермерам сохранить урожай риса

Благодаря новым технологиям искусственный инте...

Челябинские ученые сделают коммунальные машины автономными
Челябинские ученые сделают коммунальные машины автономными

Программу для управления техникой, котора...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

Small Methods: Сублимация кристаллов диарилэтена — контроль над формой
Small Methods: Сублимация кристаллов диарилэтена — контроль над формой
Натуралисты помогли выявить изменения в признаках насекомоопыляемых растений
Натуралисты помогли выявить изменения в признаках насекомоопыляемых растений
Физики разработали алгоритм для изучения запутанности в квантовых системах
Физики разработали алгоритм для изучения запутанности в квантовых системах
Хранение углерода в строительных материалах может спасти планету
Хранение углерода в строительных материалах может спасти планету
В СПбГУ создали эффективный метод очистки биодизеля от глицерина
В СПбГУ создали эффективный метод очистки биодизеля от глицерина
Новый проект ЦЕРН меняет представление о производительности и устойчивости
Новый проект ЦЕРН меняет представление о производительности и устойчивости
Синие кольца на деревьях и кустарниках говорят о холодах в прошлом
Синие кольца на деревьях и кустарниках говорят о холодах в прошлом
Квантовые датчики обеспечат технологическую революцию к 2045 году
Квантовые датчики обеспечат технологическую революцию к 2045 году
Верблюжье молоко назвали отличной альтернативой традиционным молочным продуктам
Верблюжье молоко назвали отличной альтернативой традиционным молочным продуктам
Как НАСА использует технологии искусственного интеллекта на Земле и в космосе
Как НАСА использует технологии искусственного интеллекта на Земле и в космосе
Представлены новейшие разработки в области квантовых вычислений
Представлены новейшие разработки в области квантовых вычислений
Трамп отменяет мандат Байдена на электромобили, меняя политику в отношении EV
Трамп отменяет мандат Байдена на электромобили, меняя политику в отношении EV
Термоядерный прорыв: SMART добыл первую плазму
Термоядерный прорыв: SMART добыл первую плазму
С помощью искусственного фотосинтеза получен биоразлагаемый прекурсор нейлона
С помощью искусственного фотосинтеза получен биоразлагаемый прекурсор нейлона
В ТПУ добавили отходы в пеллеты и снизили выбросы CO2 на 20%
В ТПУ добавили отходы в пеллеты и снизили выбросы CO2 на 20%

Новости компаний, релизы

На острие луча. В Сеченовском Университете состоялось открытие Академии лазерной хирургии
Университет Иннополис открыл колледж для подготовки ИТ-специалистов и робототехников
МФТИ подготовил более 140 специалистов в области синхротронных и нейтронных исследований
70% составляет готовность 18 корпусов общежитий нижегородского ИТ-кампуса
В МИФИ разработали критерии для рейтингования вузов в сфере устойчивого развития