Google Translatotron переводит устную речь голосом говорящего

579

0

Перед устным переводом в режиме реального времени открываются новые перспективы. Даже сейчас не перестает удивлять как сервисы, особенно Google Переводчик, может на лету переводить то, что мы говорим. Тем не менее, у онлайн-переводчиков есть один недостаток - почти все они говорят своими собственными синтезированными голосами.

Что бы вы почувствовали, если бы услышали, как вы мгновенно заговорили своим голосом на другом языке, который едва знаете? Именно это волшебное будущее может предложить Google Переводчик благодаря Translatotron.

Translatotron – не имя нового персонажа из «Трансформеров». Это просто прозвище, которое исследователи искусственного интеллекта из Google дали своей сквозной модели перевода речи в речь. Укороченно это звучит как EESSTM (End-to-End, Speech-to-Speech Translation Model).

13_1.jpg

Способность Translatotron сохранять голос говорящего-источника даже в переведенной речи на самом деле является лишь следствием истинной природы системы. Большинство систем перевода делят работу на три части. Одна превращает речь в текст, другая берет этот текст и переводит его на другой язык, а третья превращает текст обратно в речь, часто другим голосом, намного отличающимся от голоса исходного носителя.

Данная каскадная система доказала свою эффективность и практичность и является тем, что движет большинством систем перевода, включая Google. Исследователи искусственного интеллекта Google, однако, считают, что сквозная система может на самом деле превзойти ее, удалив лишнее звено. Она избавляется от той части, где речь сначала переводится в текст.

Translatotron еще не опередил традиционные каскадные системы в тестах, но доказал, что это по крайней мере выполнимо. Как и любая модель машинного обучения, со временем она может улучшиться. Учитывая преимущество сохранения оригинального голоса говорящего даже в переведенной речи, дальнейшие исследования в этой области могут оказаться полезными для будущих систем перевода Google на базе искусственного интеллекта. Возможно, в ближайшем будущем мы сможем разговаривать с носителями другого языка совершенно естественно, как если бы на самом деле знали их язык.

Похожие посты

Регистрация прошла успешно