Опубликовано 15 июня 2023, 18:27
1 мин.

Голосовую модель «Яндекса» научили узбекскому

Нейросеть не только «научили» понимать язык, но и «говорить» на нём
«Яндекс» расширил языковую библиотеку программ распознавания и синтеза речи, добавив туда узбекский язык. Это расширит рынок использования ПО
Голосовую модель «Яндекса» научили узбекскому

Компания «Яндекс» анонсировала новую возможность в своём продукте Yandex SpeechKit — распознавание и синтез речи на узбекском языке. Это отличная новость для автоматизации колл-центров, анализа речи и разработки голосовых помощников.

Обучение модели проходило с использованием голоса настоящего диктора. Разработчики создали обширный набор данных, содержащий тысячи часов аудиозаписей и их расшифровки. Нейросеть не только способна синтезировать речь, но и воспроизводить звуковые особенности слов, что особенно полезно при произнесении сложных фамилий и заимствованных выражений.

Yandex SpeechKit учитывает особенности узбекского языка, включая произношение буквы «х». Григорий Атрепьев, директор по продуктам в YandexCloud, отмечает, что рынок речевых технологий в Узбекистане может достигать огромных масштабов, до 395 миллионов минут обработанной речи в год. Узбекский стал 16-м языком, с которым работает Yandex SpeechKit.