Переводчик Google научился имитировать речь пользователя
Сейчас большинство гаджетов умеют переводить речь на другой язык. При этом все они действуют по одной схеме: сначала исходная речь трансформируется в текст, далее он переводится на другой язык и только потом озвучивается. Разработчики Goolge решили разорвать этот порочный круг, приводящий к большому количеству погрешностей.
Для этого специалистами корпорации был разработан алгоритм, который может напрямую переводить речь на другой язык, минуя текстовый вариант. При этом сохраняются голосовые данные и темп произношения говорящего.
Нейросеть с долгой краткосрочной памятью будет принимать голосовой ввод и обрабатывать его как спектрограмму, затем генерировать на этой основе новую спектрограмму на целевом языке.
При обучении алгоритм научился предсказывать текстовые последовательности фонем на обоих языках. Это позволило программе переводить не отдельные слова, а целые связные предложения. Пока в речи еще можно уловить роботизированные элементы, но для первой версии это уже достойный вариант. Послушать, как звучит выполненный алгоритмом перевод с одного языка на другой, можно здесь.
Ранее Google объявил о планах научить свой алгоритм распознавания голоса понимать слова людей, страдающих нарушениями речевого аппарата.
Дмитрий КУЛЬБАЦКИЙ