Искусственный интеллект МТС заговорил на татарском языке

Искусственный интеллект МТС заговорил на татарском языке
Иллюстрация: freepik.com

Компания МТС представила разработанную MTS AI новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке.

Она получила название Rehmet — что в переводе означает спасибо. 

MTS AI, один из ведущих центров компетенций по искусственному интеллекту в России, показал новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week. Она способна обрабатывать документы объемом в 5 листов A4, извлекать и суммаризировать данные за несколько секунд.

Cotype Rehmet может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России, — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель Cotype Rehmet смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Rehmet входит в число лучших LLM в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров - до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

Подробнее об MTS AI 

MTS AI —  дочерняя структура ПАО «МТС» и один из крупнейших в России центров компетенций в сфере искусственного интеллекта. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка, синтеза и распознавания речи, а также компьютерного зрения. MTS AI также проводит научные и прикладные исследования, консультирует корпорации по вопросам внедрения искусственного интеллекта в бизнес-процессы. В структуре компании есть венчурный фонд, который инвестирует в перспективные разработки. 

Реклама МТС, ERID: LjN8KNnJm

Самое читаемое
  • Реальная продуктовая инфляция в России составит 50-100% по итогам 2024 г.Реальная продуктовая инфляция в России составит 50-100% по итогам 2024 г.
  • В одном из крупнейших застройщиков России меняется генеральный директорВ одном из крупнейших застройщиков России меняется генеральный директор
  • «Больше, чем девелопмент». Крупный уральский застройщик объявил о ребрендинге«Больше, чем девелопмент». Крупный уральский застройщик объявил о ребрендинге
  • Россия обсуждает строительство трубопровода для экспорта газа в Китай через КазахстанРоссия обсуждает строительство трубопровода для экспорта газа в Китай через Казахстан
Наверх
Чтобы пользоваться всеми сервисами сайта, необходимо авторизоваться или пройти регистрацию.
  • вспомнить пароль
Вы можете войти через форму авторизации зарегистрироваться
Извините, мы не можем обрабатывать Ваши персональные данные без Вашего согласия.
  • Укажите ваше имя
  • Укажите вашу фамилию
  • Укажите E-mail, мы вышлем запрос подтверждения
  • Не менее 8 символов
Если вы не хотите вводить пароль, система автоматически сгенерирует его и вышлет на указанный e-mail.
Я принимаю условия Пользовательского соглашения и даю согласие на обработку моих персональных данных в соответствии с Политикой конфиденциальности.Извините, мы не можем обрабатывать Ваши персональные данные без Вашего согласия.
Вы можете войти через форму авторизации
Самое важное о бизнесе.