Как искусственный интеллект учится предсказывать смог честно и точно

Максим Наговицын01.04.20262395

Старые климатические модели похожи на точные, но очень медленные счеты, а глубокое обучение — на быструю, но иногда врущую электронную таблицу.

Как искусственный интеллект учится предсказывать смог честно и точно
Источник: нейросеть

Загрязненный воздух каждый год уносит миллионы жизней и продолжает вредить природе по всему миру. Ученые давно строят компьютерные модели, чтобы предсказывать, куда и как полетят вредные вещества. Эти модели называют химическими или климатическими. Но у них есть слабые места: им нужно очень много вычислительной мощности, а еще они используют устаревшие списки того, кто и сколько выбрасывает в атмосферу. Из-за этого нельзя быстро сделать точный прогноз с высоким разрешением, а такой прогноз нужен, чтобы вовремя предупредить людей и успеть вмешаться.

Зато сейчас вокруг Земли летают спутники, которые собирают огромные массивы данных. И тут на помощь приходит искусственный интеллект, а точнее — глубокое обучение. Оно отлично находит сложные закономерности и может обойти те ограничения, с которыми бьются традиционные модели. Поэтому исследователям срочно понадобилось создать такие ИИ-модели для предсказания качества воздуха, чтобы они были понятными, опирались на физические законы и легко масштабировались.

Команда под руководством профессора Хунлян Чжана из Университета Фудань вместе с коллегами из Манчестерского университета опубликовала в журнале Frontiers of Environmental Science & Engineering обзорную статью. В статье подробно рассказано, как искусственный интеллект меняет науку об атмосфере. Авторы выделили три главных направления: объединение данных из разных источников, прогнозы катастрофических выбросов и нейросети, в которые зашиты законы физики. Они также наметили, что делать дальше, чтобы системы прогноза стали надежнее, прозрачнее и полезнее для быстрого реагирования.

Что конкретно предлагают ученые? Глубокое обучение учится соединять разнородные данные со спутников, наземных станций и метеодатчиков. Так удается заполнить белые пятна на картах загрязнения, которые возникают из-за облаков или редкой сети постов. Получаются четкие, подробные карты. Но пока модели часто дают сбой во время резких выбросов, например при пожарах или авариях. А ведь именно тогда точный прогноз нужнее всего. Чтобы это исправить, исследователи предлагают три способа:

  • Перенос обучения — когда модель настраивают на редкие события, используя знания из обычных ситуаций.
  • Ансамблевое прогнозирование — когда несколько моделей работают вместе и усредняют результат.
  • Искусственное создание событий — когда генерируют синтетические данные о сильных загрязнениях, на которых можно обучить сеть.

Не менее важен переход к физически обоснованным нейросетям. В такие сети встраивают химические и физические законы. Например, закон сохранения массы или уравнения движения воздуха. Модель не просто подгоняет цифры, а учится предсказывать в согласии с реальной природой. Также авторы ратуют за вероятностные и байесовские подходы. Они позволяют оценивать не только сам прогноз, но и то, насколько ему можно верить. В итоге весь этот сдвиг означает, что мы уходим от «черных ящиков» к понятным, физически осмысленным системам. Они приближают науку к принятию реальных решений.

Физически обоснованные нейронные сети — это такие искусственные нейросети, в которые инженеры принудительно встраивают математические уравнения, описывающие реальные законы природы. Например, закон сохранения массы гласит: сколько вредного вещества выбросили в воздух, столько и должно где-то оказаться, оно не может исчезнуть или взяться из ниоткуда. Обычная нейросеть может этому закону случайно нарушить, потому что она просто подгоняет числа под примеры из обучающей выборки. А физически обоснованная сеть внутри себя решает эти уравнения либо штрафует себя за каждое отклонение от физики. Представьте, что вы учите ребенка рисовать деревья. Обычная сеть может нарисовать дерево с розовыми листьями и квадратным стволом — формально это дерево, но странное. А физически обоснованная сеть получает строгий учебник ботаники: ствол растет снизу вверх, корни в земле, листья зеленые. В итоге ее рисунки выглядят правдоподобнее, хотя она и теряет немного в гибкости. Для прогноза загрязнения воздуха это жизненно важно: нельзя, чтобы модель показывала рост концентрации диоксида серы без выбросов или чтобы облако ядовитых веществ двигалось против ветра.

Профессор Хунлян Чжан сказал так:

Мы хотим, чтобы прогноз качества воздуха стал не просто умнее, но и заслуживал больше доверия. Если объединить физические законы с глубоким обучением, мы сможем открыть черный ящик искусственного интеллекта и сделать его решения объяснимыми. Чиновники и обычные люди поймут, почему может случиться смог и как его предотвратить. Речь идет о том, чтобы превратить предсказание в профилактику, а данные — в реальные действия.

В итоге глубокое обучение станет основой умного управления природой. Благодаря прогнозам в реальном времени правительства быстрее объявят предупреждения, спланируют сокращение выбросов и защитят тех, кто больше всех страдает от грязного воздуха. Если скрестить искусственный интеллект с климатическими моделями, то можно делать долгосрочные прогнозы на сезоны и годы. Это критически важно, чтобы понять, как изменение климата повлияет на качество воздуха. Но главное — такой подход меняет саму философию борьбы с загрязнением. Вместо того чтобы просто реагировать на беду, мы начнем действовать на опережение. Авторы уверены: глубокое обучение в итоге поможет сделать небо чище, города здоровее, а планету — более устойчивой.

Для науки тут открывается интересная возможность проверить, насколько хорошо нейросети могут усваивать физические законы. Сейчас многие модели учатся на данных, но иногда выдают результаты, которые противоречат элементарной логике — например, концентрация вредного вещества растет без источника. Физически обоснованные сети могут стать новым классом инструментов, где компьютер не просто подгоняет кривые, а решает уравнения переноса и диффузии. Это сближает два лагеря: тех, кто верит только в «честные» математические модели, и тех, кто полагается на большие данные.

В реальной жизни польза ощутима сразу. Представьте город, где службы получают не просто прогноз «завтра будет смог», а еще и карту неопределенности: вот в этих районах модель уверена на 90%, а вот здесь только на 60%. Это позволяет точечно объявлять предупреждения, не парализуя весь город. Еще один пример — больницы. Зная, что через два дня ожидается резкий скачок мелкодисперсной пыли, можно заранее подготовить больше мест для пациентов с астмой или сердечными заболеваниями. Коммунальные службы — скорректировать график полива улиц или ограничить движение грузовиков. Так прогноз перестает быть абстрактной цифрой и становится руководством к действию.

Главная слабость подхода, описанного в обзоре, — нехватка качественных данных для обучения именно на редких катастрофических событиях. Исследователи сами признают, что модели спотыкаются на экстремальных загрязнениях. Предлагаемые методы — перенос обучения, синтетические данные — это паллиативы. Синтетические данные генерируются на основе тех же предположений, которые мы хотим проверить. Если мы неправильно понимаем физику редкого процесса, например химию дыма при торфяном пожаре, то и «искусственное событие» будет нести те же ошибки. Перенос обучения с обычных дней на экстремальные тоже работает лишь тогда, когда между ними есть линейная связь. На деле во время смога от лесных пожаров меняется сам химический состав аэрозолей, и модели, обученные на городских выбросах, могут давать полный промах. Кроме того, авторы не обсуждают стоимость обучения таких гибридных моделей. Физически обоснованные нейросети часто требуют решения дифференциальных уравнений на каждом шаге, что сводит на нет выигрыш в скорости по сравнению с классическими моделями. Без прорыва в аппаратном ускорении эта технология останется уделом богатых лабораторий.

Ранее ученые нашли зависимость между грязным воздухом и развитием слабоумия.

Подписаться: Телеграм | Дзен | Вконтакте


Экология


Лента новостей

Пресс-релизы