Лента TH Новости Искусственный интеллект


Google Brain использует нейронные сети для голосового перевода

∴ 141

Программа ориентирована на перевод речи в текстовый формат. С использованием нейронных сетей, процедура будет проходить качественно и в сжатые сроки.

266

Машинный перевод речи обычно работает в три этапа. В первую очередь речь распознается и записывается в транскрипции. После чего, полученный материал трансформируется в исходный текст, а затем текст переводится на другой язык. Любая ошибка в распознавании речи приведет к ошибке в транскрипции и ошибке в переводе. Команда Google Brain вырезала средний шаг. «Пропуская транскрипцию, этот подход потенциально мог бы обеспечить более точные и быстрые переводы».

Авторы описали свой подход, включающий архитектуру глубокой нейронной сети кодера-декодера, которая непосредственно переводит речь на одном языке в текст в другом.

По словам Мэтта Рейнольдса в New Scientist: «команда обучила свою систему на сотнях часов испанского аудио с соответствующим английским текстом. В каждом случае она использовала несколько уровней нейронных сетей (компьютерных систем, моделирующих работу человеческого мозга) чтобы соответствовать исходному языку и письменному переводу».

Команда использовала показатель BLEU, который оценивает уровень машинного перевода, относительно к человеку-переводчику. При максимуме в единицу, оценка нового переводчика составляет 0,9.

Филипп Дончев