Нейросеть Yandex Cloud может распознавать более 10 языков одновременно, объявила компания. С помощью неё можно создавать многоязычных голосовых помощников и роботов для колл-центров с большим потоком клиентов.
Например, нейросеть работает с английским, французским, датским, финским, турецким и другими языками. Модель распознаёт речь на любую тему - короткие и длинные фразы, имена, адреса, даты и числа. Она может переключаться между языками в любой момент разговора.
Нейросеть работает на базе архитектуры Transformer - обрабатывает вводные слова параллельно и независимо друг от друга, поэтому быстро обучается. Её готовили на десятках терабайтов данных из датасетов и сервисов и приложений "Яндекса".
Многоязычная модель работает в сервисе синтеза и распознавания речи Yandex SpeechKit. Его используют больше 1000 клиентов.