Яндекс

Yandex SpeechKit научился синтезировать и распознавать речь на узбекском языке

Облачная платформа Yandex Cloud разработала нейросети, которые могут распознавать речь и воспроизводить ее на узбекском языке. Компании как в России, так и в Узбекистане уже могут использовать новый язык в сервисе Yandex SpeechKit для создания голосовых помощников, автоматизации колл-центров и речевой аналитики.

Индивидуальная настройка синтеза

Модели синтеза речи обучались на предзаписи голоса реального диктора. При этом они умеют синтезировать речь не только из текста, но и из его фонемной записи, в которой указаны все особенности звуков в словах. Это позволит клиентам корректировать в синтезе произношение отдельных слов — сложные фамилии, названия товаров, заимствованные выражения. Для этого им нужно будет указать в тексте фонемный разбор нужного слова с помощью специального синтаксиса.

Большие датасеты для распознавания речи

Так же как и для синтеза речи, для распознавания нейросети учатся на примерах. Чтобы их обучить, специалисты Yandex Cloud собрали датасет с тысячами часов аудио и их расшифровками, в том числе короткие и длинные фразы, а также имена, адреса, даты и числа.

Узбекская латиница

Нейросети для синтеза и распознавания узбекского работают с латинским алфавитом, который используется в Узбекистане уже больше 20 лет. При этом алгоритмам пришлось выучить и некоторые звуковые особенности букв. Например, буква «X» обозначает в алфавите твердый [х], а в иностранных словах может произноситься как [кс]. 

Григорий Атрепьев,
директор по продуктам в Yandex Cloud

В Узбекистане сейчас активно развиваются сценарии, связанные с  искусственным интеллектом, в частности с речевыми технологиями. По оценке одного из наших партнеров, объем рынка речевых технологий в Узбекистане может достигать 395 миллионов минут обработанной речи в год. Появление нового шестнадцатого языка в Yandex SpeechKit — большой шаг для создания новых диалоговых сценариев как для узбекских, так и для российских компаний.

Модели доступны на сайте и настраиваются стандартными средствами в API. Синтез и распознавание узбекского языка с помощью Yandex SpeechKit уже начал использовать ряд компаний, в том числе, например, Kolesa Group. Также технологию уже тестируют интегрируют в свои решения компании-партнеры, в том числе Tomoru, JustAI, Unistar Digital и TargetAI.

Контакты:

Пресс-служба компании «Яндекс»
Мария Сучкова
Тел.: +7 495 739-70-00
Электронная почта: pr@yandex-team.ru 

МКПАО «Яндекс»

Основной офис в России: Москва

Основной офис
119021, Москва, ул. Льва Толстого, 16
Коммерческий отдел
Отдел по связям с инвесторами
Отдел по связям с общественностью
Корпоративный секретарь
Отдел устойчивого развития