Os gigantes da tecnologia Google, Microsoft e Facebook estão aplicando as lições da aprendizagem automática à tradução, mas uma pequena empresa chamada DeepL superou todos eles e elevou o campo a um novo patamar. Essa ferramenta de tradução é tão rápida quando as das grandes concorrentes, só que mais precisa e com mais nuances do que qualquer outra que testamos.
Eu só falo um pouquinho de francês além de um inglês passável, mas, por sorte, meu colega Frederic é um homem de muitas línguas. Ambos concordamos que as traduções do DeepL são, no geral, superiores às do Google Tradutor e do Bing.
Tome como exemplo a seguinte passagem de um artigo alemão, traduzido pelo DeepL (acima) e Google:
Como Frederic colocaria: “Enquanto o Google Tradutor geralmente traz uma tradução muito literal, que perde algumas nuances e expressões idiomáticas (ou então traduz essas expressões completamente errado), o DeepL costuma apresentar uma tradução mais natural e que parece mais próxima de uma feita por um profissional da tradução.
A segunda frase é analisada de forma mais natural; a medida é “projetada para” alguma coisa, em vez de somente “para” essa coisa; a polícia está “na estrada em veículos blindados”, em vez de apenas nos carros; “aparência marcial” não está perfeito (apesar de inspirado), mas é muito melhor que o absurdo que é “a turbulência dos lutadores… veio à tona”.
Alguns testes feitos por mim mesmo com obras da literatura francesa que conheço o suficiente para julgar também mostraram o DeepL saindo à frente regularmente. Menos erros de tempo, intenção e concordância, junto a um melhor entendimento e aplicação de expressões idiomáticas facilitam a leitura do texto traduzido. Isso é o que nós, e os tradutores que participaram dos testes cegos do DeepL, achamos. Mas não precisa acreditar em nós— teste você mesmo.
Apesar de ser verdade que o significado pode ser transmitido mesmo com erros desse tipo, como evidenciado pela utilidade que encontramos até no tradutor online mais simples, está longe de se garantir que qualquer coisa além das informações mais básicas seja passada adiante.
O Linguee evoluiu
O DeepL nasceu do igualmente excepcional Linguee, uma ferramenta de tradução que existe há anos e, apesar de popular, nunca conseguiu alcançar o nível do Google Tradutor — afinal esse último tem uma grande vantagem em nome e posição no mercado.
Um dos co-fundadores do Linguee, GereonFrahling, trabalhava para o Google Research, mas abandonou o posto em 2007 para começar este novo projeto.
A equipe vem trabalhando com aprendizagem automática há anos, para tarefas ligadas à tradução em si, mas foi apenas no ano passado que começaram a trabalhar de maneira mais efetiva em um novo sistema e companhia, os quais viriam a se chamar DeepL.
Num e-mail, Frahling me disse que estava o momento era propício: “Nós construímos uma rede de tradução neural que incorpora a maior parte das atualizações recentes, às quais adicionamos nossas próprias ideias.”
Uma enorme base de dados de mais de 1 bilhão de traduções e perguntas mais um método de observação direta de traduções a partir de pesquisas por termos semelhantes na internet permitiram uma base sólida na formação do novo modelo. Eles também construíram o que afirmam ser o 23º supercomputador mais poderoso do mundo, convenientemente localizado na Islândia.
Os desenvolvimentos publicados por universidades, agências de pesquisa e, de fato, os concorrentes do Linguee mostraram que as redes neurais convolucionais eram o caminho a ser seguido, em vez das redes neurais recorrentes que a companhia vinha usando anteriormente. Aqui não é o lugar para se aprofundar nas diferenças entre as CNNs (do inglês Convolutional Neural Network) e as RNNs (Recurrent Neural Network), então é suficiente dizer que para traduções mais precisas de sequências longas e complexas de palavras relacionadas, a primeira é uma melhor opção, contanto que você possa controlar suas fraquezas.
Por exemplo, se poderia dizer que uma CNN se ocupa de uma palavra de cada vez na frase. Isso se torna um problema quando, por exemplo, como acontece frequentemente, uma palavra no final da frase determina como uma palavra do início dela deve se formar. É improdutivo passar por toda a frase só para descobrir que a primeira palavra que a rede escolheu está errada, e a partir dessa informação começar de novo, então o DeepL e outros do campo da aprendizagem automática aplicam “mecanismos de monitoramento” que identificam potenciais deslizes e os resolvem antes que o CNN siga para a próxima palavra ou frase.
Existem outras técnicas secretas em jogo, é claro, e o resultado delas é uma ferramenta de tradução que eu, pessoalmente, pretendo tornar a minha primeira opção. Estou ansioso para ver a aprimoração dos demais.
Créditos das imagens: H. Armstrong Roberts/Getty Images / Getty Images
Fonte: Tradução de Luciano Venceslau do artigo em inglês DeepL schools other online translators with clever machine learning



Os comentários estão fechados.