Новости раздела

Академия наук Татарстана профинансирует русско-татарского нейропереводчика

Академия наук Татарстана профинансирует русско-татарского нейропереводчика
Фото: realnoevremya.ru/Динар Фатыхов

К озвучиванию переводчика привлекут работников ТВ, радио и театра

Как выяснило «Реальное время», республиканская Академия наук создаст нейросеть для голосового машинного перевода. На реализацию проекта будет потрачено 6,8 миллиона рублей. Согласно проектной документации, разработчики переводчика должны провести сбор, запись, сделать разметку аудиоданных и подготовить речевые датасеты татарского языка. Помимо этого, создатели должны заняться обучением акустических и языковых моделей распознавания и синтеза татарской речи, на основе собранных датасетов.

Созданный веб-сервис должен уметь распознавать и синтезировать татарскую речь. Переводчик должен быть доступен как сайт, так и в виде мобильного приложения, в нем же нужно прописать возможность для речевого перевода с русского языка на татарский и обратно. Саму платформу проработают для устройств даже с минимальными требованиями. Приложение сделают бесплатным и доступным на всех операционных системах.

realnoevremya.ru/Динар Фатыхов

Аудиоданные на татарском языке сформируют из сбалансированных стилей речи: разговорного — не менее 10%, публицистического — не менее 60% и официально-делового, художественного и научного — не менее 30%. Также в записи аудиоданных для синтеза татарской речи участие примут профессиональные дикторы, голоса озвучат мужчины и женщины, работающие на телевидении, радио или в театре. В переводчик загрузят не менее 2 000 уникальных голосов различных возрастов, полов и диалектов татарского языка.

Портал аудиолитературы на татарском языке

Как объяснили «Реальному времени» в Академии наук Татарстана, функционал голосового перевода будет работать в веб-сервисе русско-татарского машинного переводчика Таtsoft в общедоступном режиме. Полученные результаты являются базой для следующих актуальных IT-сервисов для татарского языка:

  • автоматизация субтитрирования ТВ-передач и видеороликов;
  • автоматизированный перевод выступлений;
  • веб-сайт и телеграм-бот с речевыми сервисами для населения и журналистов;
  • современный портал аудиолитературы на татарском языке;
  • татарская версия ChatGPT.
realnoevremya.ru/Динар Фатыхов

— Кроме того, русско-татарский машинный переводчик будет использоваться в системе «Смарткат» государственными учреждениями республики для подготовки нормативно-правовых актов на государственных языках Татарстана, — рассказали в Академии наук.

Как в Татарстане запускали помощника «Лилию»

Напомним, что последним голосовым помощником в Татарстане был телефонный робот «Лилия». Он помогал жителям республики в период самоизоляции во время пандемии коронавируса. В сутки «Лилия» могла обработать до 2 тысяч звонков.

realnoevremya.ru/Ринат Назметдинов

Позже ей добавили возможность подавать показания за газ, воду, тепло и электричество. Этой функцией воспользовались более 1 тысячи человек. Добавим, что бот существует и по сей день, через него также можно узнать информацию о коронавирусе, однако же по республике сервис не показывает актуальную информацию. По его информации, COVID-19 в Татарстане переболели 179 тысяч человек. Хотя по официальной статистике их число перевалило за 200 тысяч. Подать показания счетчиков также не представляется возможным, «Лилия» предлагает отправить свой номер телефона и в ответ выслать СМС-код, однако же он не приходит.


Подписывайтесь на telegram-канал, группу «ВКонтакте» и страницу в «Одноклассниках» «Реального времени». Ежедневные видео на RUTUBE, «Дзене» и YouTube-каналах «Спорт», «Общество и культура», «Бизнес и технологии».

Александр Зарипов
ТехнологииITМедиа Татарстан
комментарии 4

комментарии

  • Анонимно 28 ноя
    надеюсь, нейропереводчик будет грамотным, а не как те, что переводят 90% вывесок в городе
    Ответить
    Анонимно 28 ноя
    Надеюсь, что родной язык правильно назовут.
    Две цитаты из книги ученого-филолога:
    "... имеется достаточно оснований утверждать, что современный татарский язык - это тот же булгарский язык, его прямое, непосредственное продолжение, мало в чем отличающийся от языка VIII-IX веков, претерпевший несущественные изменения в процессе естественного развития."
    "... в "Дивану лугат ит-турки" Махмуда Кашгари, относящегося к 1072 году, как образец языка булгар приведены два песенных четверостишия, которые понятны современному читателю без всякого перевода."
    (А. Каримуллин "Татары: этнос и этноним". Казань, Татарское книжное издательство, 1988).

    "... Казанские же татары, называя себя по вере мусульманами или по происхождению булгарами, не уважают для себя названия «татарин»." (Гайнетдин Ахмеров *Известия Общества археологии, истории и этнографии при Императорском Казанском университете.— Казань, 1903 //. Предания и исторические данные о мишарях)

    Л.Н. Гумилев: "…потомки этих булгар, составляющие значительную часть населения Среднего Поволжья, по иронии судьбы называются именем «татары», а их язык «татарским». Хотя это не больше чем камуфляж." (Корни нашего родства // Известия. - 1988. - 13 апр.)
    Ответить
  • Анонимно 28 ноя
    робот Лилия))) красиво звучит
    Ответить
    Анонимно 28 ноя
    здорово, что идут в ногу со временем
    Ответить
Войти через соцсети
Свернуть комментарии

Новости партнеров