Создан язык, который вытаскивает токсины из цифрового шума

Максим Наговицын15.05.2025718

Биологи и химики получили новый инструмент для поиска скрытых загрязнителей в окружающей среде — и теперь им не нужно учиться программированию.

Создан язык, который вытаскивает токсины из цифрового шума
Минсюнь Ван (UCR) в лаборатории. Тот самый, кто придумал язык, который упростил жизнь химикам и биологам. Источник: Stan Lim/UCR

Этот язык запросов, разработанный в Калифорнийском университете в Риверсайде, позволяет быстро анализировать огромные массивы данных масс-спектрометрии и находить токсичные соединения, которые раньше оставались незамеченными.

Результаты опубликованы в издании Nature Methods.

Масс-спектрометрия — это что-то вроде химического отпечатка пальца. Она показывает, какие молекулы содержатся в образце (воздухе, воде, крови) и в каких количествах.

С ее помощью ученые определяют загрязнители в воде, компоненты лекарств и многое другое.

Но проблема в том, что данных слишком много, и без специальных навыков их не проанализировать.

Язык MassQL работает как поисковик для масс-спектрометрии.

Вместо сложного кода исследователи пишут простые запросы и сразу видят нужные закономерности.

Например, с его помощью уже нашли фосфорорганические соединения в водоемах — это компоненты антипиренов, которые могут вредить здоровью.

Мы хотели дать биологам и химикам возможность работать с данными без долгого обучения программированию, — говорит Минсюнь Ван, создатель MassQL.

Постдок Нин Чжао, которая сейчас работает в UCSD, использовала язык, чтобы проанализировать все доступные данные по масс-спектрометрии воды. Она искала эфиры фосфорной кислоты — их добавляют в антипирены.

В этих данных — миллиарды измерений. Вручную их не перебрать, — объясняет Ван.

Но MassQL действует как фильтр: он выявил тысячи соединений, в том числе ранее неизвестные.

Некоторые из этих веществ со временем распадаются, образуя новые токсичные соединения. Они могут влиять на эндокринную систему, репродуктивное здоровье и даже вызывать сердечно-сосудистые заболевания.

Как это работает

  • Ученые вводят запрос, например: «Найти все молекулы с определенной массой».
  • Система анализирует базы данных и выдает результаты.
  • Можно искать не только известные вещества, но и новые, еще не описанные в науке.

Раньше для таких задач требовались сложные алгоритмы. Теперь исследователи тратят минуты вместо месяцев.

Теперь я могу искать любые химические соединения — в воде, почве, воздухе и даже в организме человека, — говорит Чжао.

При разработке MassQL ученые столкнулись с неожиданной сложностью: химики и программисты по-разному описывают одни и те же процессы. Чтобы язык был понятен всем, в его создании участвовали около 70 специалистов.

Уже сейчас MassQL используют в десятках проектов:

  • поиск маркеров отравления алкоголем,
  • обнаружение «вечных химикатов» на детских площадках,
  • изучение сигнальных молекул бактерий.

Раньше ко мне постоянно обращались с просьбами написать отдельную программу для каждого случая, — говорит Ван.

Теперь у нас есть один универсальный инструмент. Интересно, какие еще открытия он поможет сделать.

Этот инструмент меняет правила игры в экологическом мониторинге и медицине. Раньше анализ масс-спектрометрии требовал либо ручной обработки (что невозможно при больших данных), либо сложного программирования. Теперь ученые могут быстро находить опасные вещества, даже если те еще не внесены в базы. Это особенно важно для:

  • Экологии — оперативное выявление новых загрязнителей.
  • Медицины — поиск токсинов в организме.
  • Фармакологии — ускорение разработки лекарств.

Ранее ученые разработали многоцелевой масс-спектрометр, пригодный для работы в космосе.

Подписаться: Телеграм | Дзен | Вконтакте


Экология


Лента новостей

Пресс-релизы