Искусственный интеллект МТС заговорил на татарском языке

Искусственный интеллект МТС заговорил на татарском языке
Иллюстрация: freepik.com

Компания МТС представила разработанную MTS AI новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке.

Она получила название Rehmet — что в переводе означает спасибо. 

MTS AI, один из ведущих центров компетенций по искусственному интеллекту в России, показал новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week. Она способна обрабатывать документы объемом в 5 листов A4, извлекать и суммаризировать данные за несколько секунд.

Cotype Rehmet может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России, — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель Cotype Rehmet смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Rehmet входит в число лучших LLM в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров - до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

Подробнее об MTS AI 

MTS AI —  дочерняя структура ПАО «МТС» и один из крупнейших в России центров компетенций в сфере искусственного интеллекта. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка, синтеза и распознавания речи, а также компьютерного зрения. MTS AI также проводит научные и прикладные исследования, консультирует корпорации по вопросам внедрения искусственного интеллекта в бизнес-процессы. В структуре компании есть венчурный фонд, который инвестирует в перспективные разработки. 

Реклама МТС, ERID: LjN8KNnJm

Самое читаемое
  • Павел Дуров запустил два новых проекта: сеть Cocoon и, возможно, снова женилсяПавел Дуров запустил два новых проекта: сеть Cocoon и, возможно, снова женился
  • Александр Аузан: «Внутри России две страны. Им нужно договориться и переписать правила»Александр Аузан: «Внутри России две страны. Им нужно договориться и переписать правила»
  • Лариса Долина поможет депутатам ГД выработать механизмы продажи квартир на вторичкеЛариса Долина поможет депутатам ГД выработать механизмы продажи квартир на вторичке
  • Новый глава азербайджанской диаспоры останется под арестом до следующего годаНовый глава азербайджанской диаспоры останется под арестом до следующего года
Наверх
Чтобы пользоваться всеми сервисами сайта, необходимо авторизоваться или пройти регистрацию.
Вы можете войти через форму авторизации зарегистрироваться
Извините, мы не можем обрабатывать Ваши персональные данные без Вашего согласия.
  • Укажите ваше имя
  • Укажите вашу фамилию
  • Укажите E-mail, мы вышлем запрос подтверждения
  • Не менее 8 символов
Если вы не хотите вводить пароль, система автоматически сгенерирует его и вышлет на указанный e-mail.
Я принимаю условия Пользовательского соглашения и даю согласие на обработку моих персональных данных в соответствии с Политикой конфиденциальности.Извините, мы не можем обрабатывать Ваши персональные данные без Вашего согласия.
Вы можете войти через форму авторизации
Самое важное о бизнесе.