ИИ для химиков: разработана новая модель ChemELLM

Максим Наговицын10.08.2025672

Ошибка в химических расчетах может стоить миллионы — но теперь у химиков есть цифровой помощник, который сводит риски к нулю.

ИИ для химиков: разработана новая модель ChemELLM
Источник: нейросеть

Разработка химических технологий — долгий путь от лабораторных экспериментов до промышленного внедрения. Сначала ученые ищут решение в пробирках, потом масштабируют процесс, а затем внедряют его на производстве. Чтобы все получилось, нужны усилия химиков, физиков, математиков, инженеров и даже архитекторов — каждый вносит свой вклад. Но есть проблема: специалисты из разных областей говорят на разных языках, и это усложняет совместную работу.

Сейчас на помощь приходит искусственный интеллект. Обычные ИИ-модели уже ускоряют исследования, но настоящий прорыв — это большие языковые модели (LLM), обученные на огромных массивах данных. Они могут анализировать сложную междисциплинарную информацию и предлагать решения там, где человеку потребовались бы месяцы.

Большая языковая модель (LLM) — это алгоритм ИИ, обученный на огромном объеме текстов. Он умеет предсказывать слова, отвечать на вопросы и даже генерировать новые тексты, «понимая» контекст. Например, ChatGPT — тоже LLM, но ChemELLM заточена под химическую инженерию.

Команда профессора Мао Е (Дальянский институт химической физики, Китайская академия наук) и профессора Синь Ли (iFLYTEK) создала ChemELLM — специализированную языковую модель для химической инженерии. За основу взяли Spark 70B, а затем дообучили ее на химико-инженерных данных (ChemEData — 19 миллиардов токенов для предобучения и 1 миллиард для тонкой настройки).

Результаты опубликованы в издании Chinese Journal of Catalysis.

Чтобы проверить, насколько хорошо модель справляется с реальными задачами, разработали тест ChemEBench.

Он включает три уровня:

  1. базовые знания,
  2. продвинутые концепции,
  3. практические навыки.

Результаты впечатляют: ChemELLM обогнала GPT-4o, DeepSeek-R1 и другие популярные модели.

Главное преимущество ChemELLM — ускорение разработки новых технологий. Химикам больше не нужно тратить месяцы на поиск аналогов в литературе: модель мгновенно анализирует данные и предлагает варианты.

Это особенно важно для:

  • Оптимизации процессов — например, подбор катализаторов без тысяч экспериментов.
  • Обучения — студенты и инженеры могут получать точные ответы на сложные вопросы.
  • Снижения затрат — меньше проб и ошибок = экономия ресурсов.

Модель обучали на англоязычных и китайских данных — как она поведет себя с русскоязычными терминами (например, «крекинг» vs „cracking“)? Также неясно, учитывает ли она региональные стандарты безопасности или экологические нормы, которые сильно различаются в разных странах.

Ранее мы опубликовали 10 инноваций для химической промышленности.

Подписаться: Телеграм | Дзен | Вконтакте


Хайтек

Поиск на сайте

Лента новостей

Пресс-релизы