Anunciado recentemente, a nova ferramenta se distancia do modelo “cascata” dos programas atuais. Hoje os tradutores transcrevem os áudios no idioma original, traduzem para a língua selecionada e só depois fornecem o diálogo traduzido. O problema é que realizar todas essas etapas pode abrir diversas brechas para erros. Em 2017, o Google já estudava uma forma de redefinir traduções deixando o modo cascata de lado e investindo no end-to-end (de ponta-a-ponta, em uma tradução livre).
Como funciona o Translatotron
Foi com o Translatotron que o Google conseguiu realizar todo esse processo sem intermediários, de forma direta. Utilizando o modelo de rede ponta-a-ponta, a nova ferramenta processa a voz em formato de espectrograma – uma representação visual das frequências – gerando outro no idioma escolhido pelo usuário. O resultado é uma tradução mais rápida e com menos probabilidade de erros ou palavras perdidas durante o processo. Utilizando o algoritmo BLEU (usado na avaliação de textos traduzidos por IAs), foi possível comprovar a viabilidade do novo sistema em comparação com o atual. Ao escutar os exemplos, podemos notar que a tradução ficou menos robótica, conseguindo copiar expressões de maneira um pouco mais natural. Os exemplos foram disponibilizados pela própria empresa e estão na página da pesquisa. Confira alguns a seguir: (Voz feminina) Áudio em Espanhol: ¿Sabes? Cuando no conoces la ciencia, no ves el cuadro completo. (Voz feminina) Tradução para o inglês: You know, when you do not know the science, you do not see the whole picture. (Voz masculina) Áudio em espanhol: Larry me preguntó cómo me sentía y creo que es cuando empecé a llorar. (Voz masculina) tradução para o inglês: Larry asked me how I felt and I think that is when I started to cry. Outro diferencial é um componente opcional que mantém as características vocais, reconhecendo vozes masculinas e femininas. Esse codificador é baseado nos sistemas de verificação e reconhecimento por voz, sendo capaz de codificar e criar espectrogramas em diferentes idiomas, mas com atributos similares.
Um passo para o futuro
Mesmo estando em fase experimental, o Translatotron representa um avanço nas tecnologias de inteligência artificial que, futuramente, diminuirão ainda mais as barreiras de idiomas. Vale lembrar que o Google é uma das empresas que mais investe em tecnologias de tradução, como a atualização que traduz placas e letreiros com a câmera do celular. Em alguns países, o Google Translate até imita sotaques regionais.