Как тувинский язык появился в Google и Яндекс Переводчики: история программиста Али Кужугета

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Благодаря программисту Али Кужугету тувинский язык стал доступен в Google Переводчик — крупнейшей в мире поисковой системе и транснациональной технологической корпорации. Нашей редакции удалось побеседовать с ним о его пути, работе и планах.

— Расскажите о своей текущей деятельности. Кем вы работаете, где учились и почему выбрали эту профессию? Какими были ваши студенческие годы?

— Сейчас я занимаюсь разработкой мобильных приложений и созданием системных клавиатур для iOS и Android. Моя цель — сделать так, чтобы при настройке телефона можно было так же легко выбрать тувинскую, татарскую или клавиатуру другого языка России, как сейчас выбирают русскую или английскую. Речь идёт о полноценной системной поддержке: правильные буквы, удобный ввод, автокоррекция. Уже есть прогресс: в ближайшем крупном обновлении Android появится тувинская системная клавиатура. По iOS работа также активно ведётся совместно с разработчиками Apple и языковыми активистами из разных регионов России.

Параллельно я работаю в сфере машинного обучения и языковых технологий. Сегодня для этого необязательно оканчивать вуз — многое можно изучить онлайн, всё зависит от самоорганизации и интереса.

Я учился в Государственном лицее Республики Тыва, а затем на механико-математическом факультете Новосибирского государственного университета. Интерес к точным наукам возник не из-за формул, а из желания понять устройство мира — через природу, науку, истории учёных. Учёба в лицее и университете укрепила этот интерес. Студенчество было непростым, но оно научило меня терпению, самостоятельности и умению доводить дело до конца.

— У вас всегда были способности к точным наукам? Что было самым сложным в освоении программирования? Кто вас поддерживал? Что мотивирует вас работать в этой сфере?

— Склонность к точным наукам у меня была с детства, но я не считаю это исключительно врождённым даром. Я мог бы стать, например, борцом или художником, но меня больше привлекали книги о планетах, кибернетике, оптике.

Меня интересовали не столько формулы, сколько личности учёных, их путь.

В программировании самое сложное — это неочевидность решений. Иногда над задачей можно думать дни или недели, но, когда всё наконец получается, это даёт мощные эмоции. Для меня программирование сродни искусству или строительству — из ничего создаётся работающая система. Это требует терпения и внутренней устойчивости.

Меня поддерживали семья, преподаватели, друзья. В лицее огромную роль сыграл мой учитель Михаил Петрович Красильников — он верил в меня, даже когда первые три месяца у меня были нулевые результаты по программированию. На каникулах я нагнал, а потом и перегнал одноклассников. Этот опыт показал: важно не как ты стартуешь, а то, чтобы не сдаваться.

Меня вдохновляет мысль, что технологии могут быть полезны конкретным людям, моему народу, способствовать развитию нашей культуры и знаний о ней.

— Почему вы решили заняться сохранением тувинского языка? Как пришла идея добавить его в Google Переводчик и как шёл этот процесс?

— Раньше в Интернете невозможно было грамотно писать на тувинском — не было букв ?, ?, ?. Ситуация ухудшалась: молодёжь видела искажённые слова и привыкала к неправильной «грамматике». Я задумался, как это исправить и одновременно повысить престиж языка.

Проблема была не в отсутствии желания, а в нехватке инструментов. Я углубился в IT, и в результате появились тувинские клавиатуры для всех основных ОС, мобильные словари, приложения с музыкой.

Параллельно мы перевели интерфейс ВКонтакте и вместе с командой активистов создали раздел Википедии на тувинском. Затем начали системно собирать переводы на сайте tyvan.ru. Со временем мы накопили большой массив данных, проверенный профессиональными переводчиками и учёными из ТИГПИ. В проекте участвовало более 300 человек.

Затем я вышел на разработчиков Google Переводчика и передал им собранные переводы в формате, подходящем для машинного обучения. В результате в 2024 году тувинский язык появился в сервисе.

Работа продолжилась: сейчас я занимаюсь переводом датасетов Google на русский язык (профессиональный перевод был выполнен и оплачен мной лично). Это значит, что в ближайшее время десятки языков России смогут использовать эти данные, что улучшит качество переводов в Google.

Эта же системная работа привела к тому, что весной 2025 года тувинский язык добавили и в Яндекс Переводчик. Это доказывает: языки попадают в технологии благодаря качественным данным и последовательной работе.

В этом же году мы с разработчиком Google Переводчик опубликовали научную статью, которую представили на крупной международной конференции в Китае, где я входил в программный комитет.

Актуальность этой работы огромна. Если язык отсутствует в клавиатурах, переводчиках, поиске и ИИ, он начинает исчезать не потому, что его не любят, а потому что им неудобно пользоваться. Цифровая среда — это новое жизненное пространство языка.

— Какие чувства у вас вызывает проделанная работа? Какие у вас дальнейшие планы для родной республики и её жителей?

— Я вижу, что эта работа востребована. Ко мне часто обращаются представители других языков России за советом или помощью. Я стараюсь не отказывать, понимая свою ответственность. Часто для развития языка не хватает не ресурсов, а понимания, как выстроить процесс.

Создание системных клавиатур и технологий возможно, когда удаётся наладить взаимодействие с командами Apple, Google, Microsoft, Unicode. Моя задача — помогать народам России переносить письменность с бумаги в цифру. Так язык обретает будущее, а его носители — уверенность.

В дальнейшем я планирую продолжать работу на стыке передовых технологий и культуры, создавать полезные программы. Сейчас я нахожусь в Кремниевой долине, где особенно эффективно выстраиваются такие масштабные проекты и технологические связи.

— Чем вы увлекаетесь в свободное время? Чем запомнился уходящий год?

— Почти всё свободное время я посвящаю программированию. Если беру в руки гитару — играю свою музыку, иногда с тувинскими мотивами. Люблю решать задачи для собеседований, тестировать новые технологии, изучать машинное обучение. Также активно учу английский и понял, что его эффективнее осваивать через фонетику и живое звучание, а не только через текст.

Уходящий год запомнился тем, что многие долгосрочные проекты дали результат: тувинская клавиатура была добавлена в Android (скоро выйдет), состоялось продуктивное общение с разработчиками крупных компаний, я переехал из Майами в Сан-Франциско. Тувинский язык появился в Яндекс Переводчик и был добавлен в систему Unicode, что в будущем позволит выбирать его прямо в настройках телефона. Я посещал лекции в Стэнфорде, общался со стартаперами и сочинил две музыкальные композиции для дошпулуура.

— Что бы вы посоветовали молодым читателям нашего журнала?

— Постоянно учитесь и разбирайтесь в современных технологиях, включая ИИ. Развивайте мышление, изучайте языки, расширяйте кругозор. Активно пробуйте разные нейросети.

Обязательно берегите здоровье — избегайте алкоголя (это сильный канцероген), курения и других вредных привычек. Ясный ум и здоровье — основа долгой и активной жизни.

Не бойтесь запускать собственные проекты. Даже если они не станут успешными сразу, каждый из них — это тренировка мышления и ответственности. В жизни может быть десяток стартапов, и это нормально.

Главное — не ждите идеальных условий. Начинайте с того, что есть. И при этом помните о своих корнях: умейте сохранять и представлять культуру, петь х??мей, создавать что-то традиционное. Умение соединять современность и традиции всегда будет вашим преимуществом.

Мария СААЯ.

Фото Али КУЖУГЕТ


Источник: vk.com

Комментарии: