O Google Translatotron traduz e imita a própria voz do usuário

O Google Translatotron traduz e imita a própria voz do usuário

Podemos estar à beira de alcançar um vale misterioso quando se trata da tradução em tempo real da palavra falada. Já é incrível como os sistemas, principalmente os do Google, agora são capazes de traduzir o que dizemos em tempo real, mas quase todos falam com suas próprias vozes obviamente sintetizadas. O que você sentiria se se falasse falando outro idioma que mal conhece? Esse é o futuro mágico e quase perturbador que o Google Translate pode oferecer graças ao Translatotron.

Translatotron não é um novo personagem dos Transformers. É apenas o apelido que os pesquisadores de IA do Google deram ao seu modelo de tradução de ponta a ponta, fala a fala. O EESSTM (Estima?) Simplesmente não soa tão cativante nem tão torcido quanto a língua.

A capacidade do Translatotron de reter a voz do falante de origem, mesmo na fala traduzida, é na verdade apenas um efeito da verdadeira natureza do sistema. A maioria dos sistemas de tradução divide o trabalho em três partes. Um transforma discurso em texto, outro pega esse texto e o traduz em outro idioma, enquanto o terceiro transforma o texto de volta em discurso, geralmente com uma voz diferente do orador original.

Este sistema em cascata provou ser eficiente e prático e é o que impulsiona a maioria dos sistemas de tradução, incluindo o Google. Os pesquisadores de inteligência artificial do Google, no entanto, acreditam que um sistema de ponta a ponta pode realmente superá-lo removendo o intermediário. Literalmente, pula a parte em que a fala é traduzida em texto primeiro.

A Translatotron ainda não superou os sistemas em cascata tradicionais nos testes da equipe, mas provou que era pelo menos viável. Como qualquer modelo de aprendizado de máquina, ele pode melhorar com o tempo. Dada a vantagem de preservar a voz original do interlocutor, mesmo no discurso traduzido, novas pesquisas nesse campo podem ser frutíferas para os futuros sistemas de tradução baseados em IA do Google.

0 Shares