Язык клеток: ИИ научился переводить с биологического на понятный
Представьте себе инструмент, который может разобрать на составляющие сложнейший клеточный коктейль человеческой ткани.

Ученые из Онкологического института Найт при Университете здоровья и науки Орегона создали новый мощный инструмент, который кардинально упрощает изучение клеточного состава человеческих тканей.
Это крайне важно для понимания таких болезней, как рак. Инструмент назвали OmicsTweezer.
Подробности опубликованы в издании Cell Genomics.
Обычно, чтобы разобраться, из каких клеток состоит опухоль и ее микроокружение, ученые используют два типа данных.
- Первый — это массовые данные (bulk data), когда берут кусочек ткани, например, из биопсии, и анализируют все его содержимое разом, получая усредненный результат.
- Второй — данные по единичным клеткам (single-cell data), которые дают детальный портрет каждой клетки, но их получить очень дорого и сложно.
Проблема в том, что эти данные часто не совпадают из-за разницы в методах сбора, словно их сделали на разных аппаратах с разными настройками. Эта нестыковка, «эффект партии», сильно мешала точному анализу.
OmicsTweezer решает эту проблему с помощью передовых методов машинного обучения. Он действует как умный переводчик: берет известные паттерны из данных по единичным клеткам и сопоставляет их со сложной смесью массовых данных. Инструмент размещает оба типа данных в общем цифровом пространстве, выравнивая их и сводя к минимуму ошибки. Это позволяет с высокой точностью оценить состав клеток в образце.
Микроокружение опухоли, состоящее из разнообразных клеток, которые влияют на развитие рака и исход лечения, давно является одним из наших главных исследовательских приоритетов, — говорит старший автор работы Чжэн Ся, доктор философии, доцент кафедры биомедицинской инженерии. — Наша цель — определять клеточный состав, используя массовые данные большого количества клинических образцов.
Преимущества подхода:
- Масштаб: Позволяет анализировать огромные объемы уже существующих массовых данных, что раньше было невозможно.
- Точность: Глубокая нейросеть находит сложные, нелинейные зависимости в данных, которые не улавливают традиционные линейные модели.
- Доступность: Открывает возможности для масштабных исследований без гигантских затрат на единично-клеточные технологии.
Инструмент уже протестировали на смоделированных данных и реальных образцах от пациентов с раком простаты и раком толстой кишки. OmicsTweezer успешно выявлял даже редкие подвиды клеток и отслеживал, как меняется их популяция у разных групп пациентов. Это может помочь найти новые мишени для терапии.
Разработка стала возможной благодаря сотрудничеству в рамках проекта SMMART (Serial Measurements of Molecular and Architectural Responses to Therapy) — флагманской программы института, направленной на подбор персонализированного лечения для пациентов с запущенными формами рака.
Такая работа невозможна в одиночку, — подчеркивает Чжэн Ся. — Это настоящая командная работа.
Реальная польза этого исследования заключается в демократизации высокоточного клеточного анализа. В мире накоплены терабайты массовых данных (bulk RNA-seq) с образцов тысяч пациентов, хранящихся в биобанках и базах данных. OmicsTweezer, по сути, дает ключ к их повторному, но уже гораздо более глубокому анализу. Мы можем ретроспективно изучить эти архивы и найти корреляции между составом клеток в микроокружении опухоли и эффективностью конкретного лекарства, выживаемостью пациентов или побочными эффектами. Это прямой путь к созданию новых диагностических панелей и биомаркеров, которые помогут онкологам принимать более взвешенные решения о лечении.
Основное замечание касается ограниченных исходных данных. Метод критически зависит от качества и полноты клеточного атласа. Если в данных по единичным клеткам отсутствует какой-то редкий или новый тип клеток, либо его сигнатура определена неточно, OmicsTweezer не сможет волшебным образом обнаружить его в массовых данных. Алгоритм может только найти то, что уже знает. Таким образом, точность инструмента не абсолютна и всегда привязана к текущему уровню наших знаний о клеточном разнообразии, которое само по себе постоянно пересматривается и уточняется.
Ранее ученые выяснили, как форма ткани влияет на движение клеток.



















