В ТПУ исследуют исчезающие хантыйский и мансийский языки
Ученые из Томского политехнического университета вместе с коллегами изучают два языка, которые находятся под угрозой исчезновения: ваховский хантыйский и сосьвинский мансийский.

Эти исследования помогут создать первые онлайн-тренажеры и разработать алгоритмы языковых моделей. Проект получил поддержку от Российского научного фонда и будет продолжаться в 2025–2026 годах.
Хантыйским языком пользуются около 9,5 тысячи человек, а мансийским — примерно тысяча. Специалисты обеспокоены тем, что эти языки могут исчезнуть, потому что молодежь не перенимает их от старшего поколения. Кроме того, мало учителей, которые хорошо знают эти языки и могут научить им детей. Правила этих языков еще не полностью изучены и описаны, поэтому их нет в школьных учебниках.
Мансийский и хантыйский языки очень похожи, так как они оба относятся к угорской подветви финно-угорских языков. Это позволяет ученым изучать их развитие и то, как они влияют друг на друга. Исследователи могут найти общие черты, которые помогут понять историю перемещения народов и их общения.
У этих языков есть много диалектов, что дает возможность изучить, как язык меняется в зависимости от того, где живут люди, говорящие на нем. Например, у мансийского и хантыйского языков есть несколько диалектов, которые сильно отличаются друг от друга, – говорит руководитель проекта, доцент отделения иностранных языков Школы общественных наук ТПУ Виктория Воробьева, отмечая, что особый акцент в исследовании будет сделан на изучение глагольных форм в контексте системных характеристик. Это позволит выявить их взаимосвязи и роли в структуре языка.
Ученые продолжают работу над проектом, который получил поддержку от научного фонда России. Этот проект основан на более ранних исследованиях.
В своей работе ученые будут использовать данные, которые собрали во время экспедиций к местам проживания ваховских и аганских ханты в 2017–2020 годах. Часть этих данных уже оцифрована и доступна в виртуальной лаборатории «ЛингвоДок».
Кроме того, ученые планируют собрать еще данные в местах проживания коренного населения в Ханты-Мансийском автономном округе.
В селе Корлики и родовых угодьях живут люди, которые говорят на ваховском хантыйском языке. Их очень мало, и добраться до села непросто. Именно поэтому там все еще можно увидеть настоящую жизнь и культуру ваховских хантов. Сейчас важно собрать информацию об их языке, потому что большинство людей, которые помнят его и могут на нем говорить, — это пожилые люди, – подчеркивает ученый.
Исследователи разговаривают с людьми, для которых язык изучения является родным. Они используют разные методы: записывают речь и проводят опросы по определенным темам.
Полученные аудиозаписи обрабатывают в специальной программе. Текст делят на слова и фразы, а затем переводят на русский язык.
Обработанный файл отправляют в лингвистическую лабораторию «ЛингвоДок».
В рамках проекта мы планируем изучить и расшифровать языковые данные, которые уже собрали. Затем мы соберем новые данные по диалектам хантыйского и мансийского языков. Это позволит нам увеличить объем доступной информации.
Затем мы проанализируем полученные данные с помощью специальной программы «ЛингвоДок». В результате мы сможем уточнить некоторые спорные моменты в грамматике этих языков. Особенно это касается характеристик глагола.
Итогом нашей работы станет корпус обско-угорских языков — собрание данных, которое может стать основой для создания новых продуктов. Например, онлайн-словарей или тренажеров для изучения языка. Также эти данные могут быть использованы для разработки алгоритмов перевода между языками и генерации текстов.
До сих пор не существовало масштабной цифровой базы данных по этим языкам, которая позволила бы ученым анализировать и проверять информацию в режиме онлайн, – подытоживает Виктория Воробьева.
В исследовании участвуют сотрудники ТПУ, ТГУ, ТГПУ и Института языкознания РАН.
Ранее ученые подсчитали, что 97% мирового населения говорит на 4% языков.
Источник фото: Виктория Воробьева.



















