Большая языковая модель на тибетском языке преодолевает «цифровой разрыв» в эпоху ИИ

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



2026-05-18 11:15

«Большие языковые модели в основном обучаются на китайском, английском и других языках, поэтому их понимание и генерация текста на тибетском языке оставляют желать лучшего, — говорит ЦайжанДунчжи, аспирант Сицзанского университета, занимающийся разработкой большой языковой модели на тибетском языке.—Ответам, которые дают обычные большие языковые модели, часто не хватает естественности, языкового чутья и аутентичного колорита тибетскогоязыка, в них слишком явно видны следыискусственного кодирования». Тибетская большая языковая модель, обучаемая на корпуса тибетского языка и мыслящая на тибетском, способна восполнить этот недостаток.

Дорджи Мэйцзю, продакт-менеджер большой языковой модели на тибетском языке DeepZang, рассказал, что для DeepZang собрано почти 70 миллионов единиц тибетско-китайского параллельного корпусаи более 30 500 часов записей устной речи на тибетском языке, которые охватывают три основные диалектные зоны: У-Цанг, Кам и Амдо.

По словам Дорджи Мэйцзю, в разных диалектных зонах используется единая письменность, но устная речь сильно различается. Благодаря обучению на корпусе тибетской речи из основных диалектных регионов ИИ способен поддерживать междиалектное общение на тибетском языке.Согласно информации о патенте компании JueluoDigitalIndustryCo., Ltd., разработчикаDeepZang,размещенном на сайтеГосударственное управление по правам интеллектуальной собственностиКНР, технология компании, сочетающая распознавание голосовых характеристик и классификацию диалектов, позволяет эффективно решить проблему коммуникации, вызванныеразличиями в диалектах.

Способностьраспознавать речь на разных диалектах позволяет эффективно снизить порог для использования большой языковой модели на тибетском языке. «Не нужно владеть письменным тибетским на высоком уровне, можно пользоваться ИИ с помощью голоса, и это поможет большему количеству людей», отмечает ЛосанДуньюйкоторый работает переводчиком с тибетского на китайский в городе ЛхокхаСицзанского автономного района.Его коллеги уже привыкли использовать большую языковую модели на тибетском языкев работе. «Раньше один текст переводили два-три человека и тратили около 40 минут. Теперь же, с помощью ИИ, один переводчик может справиться всего за 20 с лишним минут».

Согласно информации, предоставленной компанией JueluoDigital, сейчас у DeepZang более 300 000 пользователей, более 70% из которых — молодые люди в возрасте от 18 до 40 лет. «Наши пользователи в основном проживают в автономном районе Сицзан, провинциях Цинхай, Сычуань и Ганьсу, и очень многие из них — в довольно удаленных районах», — рассказалДорджи Мэйцзю.

В Сицзанеэлектросеть охватывает все уезды (районы, города), а 70% волостей и сел имеют доступ к сетям 5G. Благодаря развитию электро- и телекоммуникационной инфраструктуры ИИ на тибетском языке поможет еще большему числу носителей тибетского языка.


Телеграм: t.me/ainewsline

Источник: vk.com

Комментарии: