ИИ для химиков: разработана новая модель ChemELLM
Ошибка в химических расчетах может стоить миллионы — но теперь у химиков есть цифровой помощник, который сводит риски к нулю.

Разработка химических технологий — долгий путь от лабораторных экспериментов до промышленного внедрения. Сначала ученые ищут решение в пробирках, потом масштабируют процесс, а затем внедряют его на производстве. Чтобы все получилось, нужны усилия химиков, физиков, математиков, инженеров и даже архитекторов — каждый вносит свой вклад. Но есть проблема: специалисты из разных областей говорят на разных языках, и это усложняет совместную работу.
Сейчас на помощь приходит искусственный интеллект. Обычные ИИ-модели уже ускоряют исследования, но настоящий прорыв — это большие языковые модели (LLM), обученные на огромных массивах данных. Они могут анализировать сложную междисциплинарную информацию и предлагать решения там, где человеку потребовались бы месяцы.
Большая языковая модель (LLM) — это алгоритм ИИ, обученный на огромном объеме текстов. Он умеет предсказывать слова, отвечать на вопросы и даже генерировать новые тексты, «понимая» контекст. Например, ChatGPT — тоже LLM, но ChemELLM заточена под химическую инженерию.
Команда профессора Мао Е (Дальянский институт химической физики, Китайская академия наук) и профессора Синь Ли (iFLYTEK) создала ChemELLM — специализированную языковую модель для химической инженерии. За основу взяли Spark 70B, а затем дообучили ее на химико-инженерных данных (ChemEData — 19 миллиардов токенов для предобучения и 1 миллиард для тонкой настройки).
Результаты опубликованы в издании Chinese Journal of Catalysis.
Чтобы проверить, насколько хорошо модель справляется с реальными задачами, разработали тест ChemEBench.
Он включает три уровня:
- базовые знания,
- продвинутые концепции,
- практические навыки.
Результаты впечатляют: ChemELLM обогнала GPT-4o, DeepSeek-R1 и другие популярные модели.
Главное преимущество ChemELLM — ускорение разработки новых технологий. Химикам больше не нужно тратить месяцы на поиск аналогов в литературе: модель мгновенно анализирует данные и предлагает варианты.
Это особенно важно для:
- Оптимизации процессов — например, подбор катализаторов без тысяч экспериментов.
- Обучения — студенты и инженеры могут получать точные ответы на сложные вопросы.
- Снижения затрат — меньше проб и ошибок = экономия ресурсов.
Модель обучали на англоязычных и китайских данных — как она поведет себя с русскоязычными терминами (например, «крекинг» vs „cracking“)? Также неясно, учитывает ли она региональные стандарты безопасности или экологические нормы, которые сильно различаются в разных странах.
Ранее мы опубликовали 10 инноваций для химической промышленности.



















