ИИ расшифровал правила слипания белков — кошмар фармкомпаний
Искусственный интеллект научился лучше понимать язык белков — тот самый, который заставляет их слипаться в опасные комки, связанные с болезнью Альцгеймера и еще полусотней заболеваний.

В отличие от обычных «черных ящиков», новая модель CANYA объясняет свои выводы, показывая, какие именно химические закономерности приводят к слипанию белков или, наоборот, предотвращают его.
Исследование, опубликованное в Science Advances, стало возможным благодаря самой большой в мире базе данных о белковой агрегации.
Оно раскрывает новые детали о механизмах, стоящих за образованием белковых сгустков, которые вызывают болезни у полумиллиарда человек.
Когда определенные участки белков прилипают друг к другу, они образуют плотные волокна, нарушающие работу клеток.
Хотя открытие может ускорить изучение нейродегенеративных заболеваний, его главное применение — биотехнологии.
Многие лекарства — это белки, и их производство часто осложняется нежелательным слипанием.
Белковая агрегация — кошмар фармкомпаний, — говорит доктор Бенедетта Болоньези, соавтор исследования.
Если терапевтический белок начинает слипаться, партия бракуется, а это время и деньги. CANYA поможет создавать антитела и ферменты, которые меньше склеиваются, и сократит потери.
Белки состоят из 20 типов аминокислот — как будто из букв алфавита. Их комбинации образуют «слова» или мотивы. Ученые давно пытаются понять, какие сочетания приводят к слипанию, а какие — к правильному сворачиванию. ИИ, который анализирует аминокислоты как язык, мог бы помочь, но данных всегда не хватало.
Чтобы решить проблему, авторы синтезировали более 100 000 случайных белковых фрагментов по 20 аминокислот каждый и проверили, как они ведут себя в дрожжевых клетках. Около 22% фрагментов вызвали слипание, остальные — нет.
Мы создали совершенно случайные последовательности, — объясняет доктор Майк Томпсон, первый автор.
Эволюция исследовала лишь крошечную часть возможных вариантов, а наш метод позволяет увидеть гораздо больше.
Данные использовали для обучения CANYA. Модель сочетает два подхода:
- Сверточные сети (как в распознавании изображений) — ищут в белке значимые участки, как будто слова в тексте.
- Механизм внимания (как в переводчиках) — определяет, какие мотивы важнее всего.
Это помогает CANYA не только предсказывать слипание, но и объяснять, почему оно происходит. Например, она подтвердила, что гидрофобные аминокислоты чаще провоцируют агрегацию, а заряженные — обычно мешают, но в некоторых комбинациях, наоборот, ускоряют.
Пока CANYA работает как классификатор ( «слипнется — не слипнется»), но ученые хотят научить ее предсказывать скорость процесса. Это критично для нейродегенеративных болезней, где важно не только образование комков, но и то, как быстро это происходит.
Возможных комбинаций из 20 аминокислот — 10²⁴, а мы обучили ИИ всего на 100 000, — говорит Болоньези. — Но уже ясно: язык белковой агрегации можно расшифровать. Это важно и для медицины, и для синтетической биологии.
Такой подход — когда массовые эксперименты сочетаются с ИИ — ускоряет науку, — добавляет профессор Бен Ленер. — Мы делаем биологию предсказуемой.
Этот прорыв важен в трех аспектах:
- Фармацевтика — снижение затрат на производство белковых препаратов за счет предотвращения агрегации.
- Медицина — понимание механизмов болезней вроде Альцгеймера, где ключевую роль играет скорость образования амилоидных бляшек.
- Синтетическая биология — дизайн новых белков с заданными свойствами, например, устойчивых к слипанию ферментов для промышленности.
CANYA — не просто предсказательный инструмент, а система, которая объясняет свои выводы. Это редкость в мире ИИ и критически важно для науки: понимание «почему» позволяет целенаправленно менять структуру белков, а не действовать вслепую.
Ранее ученые объяснили, как правильно общаться с людьми с диагнозом Альцгеймера.



















