Ученые научили ИИ понимать иерархию клеток
Ученые нашли способ заставить данные о клетках из сотен исследований говорить на одном языке.

Представьте, что перед вами рассыпаны тысячи пазлов, и вы пытаетесь угадать, какая картина из них получится. Без подсказок это почти невозможно.
Так же и биологи сегодня сталкиваются с огромными массивами данных, полученных при анализе тысяч отдельных клеток. Геномной информации много, но без контекста трудно понять, как она связана со здоровьем и болезнями.
Ученые решают это, определяя типы клеток — как если бы сортировали пазлы по цвету или узору перед сборкой. Но если один исследователь группирует клетки по форме, а другой — по функции, сравнить их результаты сложно.
Команда Gladstone Institutes создала инструмент, который решает эту проблему. Метод CellWalker2 показывает, как типы клеток связаны между собой и какие группы могут влиять на здоровье.
Результаты опубликованы в издании Cell Genomics.
Раньше мы не учитывали, что одни клетки — как близкие родственники, а другие — как дальние, — говорит Кэти Поллард, руководитель исследования.
CellWalker2 использует иерархию: если точный тип клетки не ясен, алгоритм присвоит ей общую категорию.
Клетки не случайные ярлыки, — объясняет Чжируй Ху, один из разработчиков. — Два нейрона на разных стадиях развития похожи, а иммунная и мышечная клетки — совсем разные. CellWalker2 это учитывает.
Инструмент также помогает сравнивать данные разных лабораторий и даже видов. Например, он показал, какие участки ДНК активны в иммунных клетках и как мозг человека отличается от мозга мартышки.
CellWalker2 уже доступен ученым.
Теперь мы можем связать генетические мутации с конкретными клетками, — говорит Поллард. — Это ключ к пониманию болезней вроде аутизма или шизофрении.
Этот метод:
- Ускоряет анализ — вместо ручного сопоставления данных алгоритм автоматически находит связи.
- Унифицирует стандарты — разные лаборатории смогут сравнивать результаты без путаницы в терминах.
- Раскрывает механизмы болезней — показывает, какие именно клетки и гены вовлечены в патологии.
- Экономит ресурсы — уменьшает дублирование исследований за счет reuse данных.
Хотя CellWalker2 мощный инструмент, его точность зависит от качества входных данных. Если в оригинальных исследованиях клетки были mislabeled, ошибки перейдут и в анализ. Нужна валидация на независимых наборах данных.
Ранее ученые обнаружили память у биологических клеток.