Robôs traduzindo

Humanos são falhos, logo a solução para melhorar a qualidade das traduções seria usando automação?

Já postei aqui sobre quando eu usei o Google Translate para traduzir a letra das músicas de um anime do italiano para o português. Na minha opinião os resultados foram ruins. De um ponto de vista de pesquisas como essa eu consideraria que a tradução ficou entendível, mas não ficou natural, como eu escrevi na postagem anterior, ficou em um nível Tarzan.

Mas, considerando que nos últimos anos houve um avanço no campo de tradução usando redes neurais, não bastaria apenas revisar a tradução para torná-la mais natural? Não basta: uma tradução ruim revisada não deixa de ser uma tradução ruim.

Se mesmo tradutores humanos conseguem inverter o sentido de frases inteiras, como ocorreu na Bíblia Maldita em 1631, então é muito mais provável que erros assim ocorram em traduções automáticas. Não é só mais provável: já aconteceu comigo algumas vezes.

Quando o sentido de uma frase é invertido uma simples revisão não é suficiente para corrigir o problema. O revisor deve ter o bom senso de descobrir que há algo errado no sentido daquela frase. Esses problemas podem se apresentar de várias formas, como:

Em todos esses exemplos houve alguém que, supostamente, deveria ter revisado essas traduções, e mesmo assim, esses erros aconteceram. Por quê?

Pois não esse não é o trabalho do revisor! Sejam empresas, pequenos ou grandes grupos, nunca fiquei sabendo de um que cobrasse dos revisores conhecimento suficiente para corrigir esses erros. Eles cobram conhecimento de língua portuguesa justamente porque o trabalho deles é tornar traduções tipo “Tarzan” em traduções naturais e só.

Por acaso isso significa que no futuro bastaria substituir os atuais tradutores por algoritmos e redes neurais, demitir os atuais revisores e colocar os atuais tradutores no lugar deles?

Não! Cada cargo trabalha da sua própria forma, o que significa que alguém que é muito bom traduzindo nem sempre é muito bom revisando. Um exemplo: já mostrei esse último erro desta lista para vários tradutores que conheço e até agora não vi nenhum que conseguiu identificar o problema sem eu dar a resposta.

Essa lista só mostra alguns poucos exemplos, mas eles são absurdamente comuns e pouco notados. Alguns são da CR? São, porém a maior parte deles são de grupos que são proclamados por dezenas, talvez até centenas, como grupos “bons”. Seriam esses casos isolados? Absolutamente não: há episódios onde eles aparecem uma meia dúzia de vezes, em outros eles aparecem dezenas de vezes, e mesmo assim, como os revisores fazem de tudo para fazer as falas parecerem naturais, ninguém os nota.

Mas se ninguém nota, por que eu noto? Por que erros como esse acontecem até em traduções em inglês (que é o segundo exemplo)? Suponho que o motivo é simples:

  • Quem sabe japonês prefere assistir diretamente em japonês;
  • Quem não sabe e/ou acredita que o tradutor se esforçou ao máximo (o que nem sempre é verdade) acaba confiando cegamente nele e mesmo que ache que a fala não faça sentido, ele inventa uma justificativa para o erro;
  • Eu não sei japonês direito e nem confio em nenhum tradutor, então tento conferir tudo o que leio com o que eu ouço, se se algo me pareceu errado eu pauso e tento descobrir o que aconteceu.

Como eu disse anteriormente eu uso meus scripts e por causa deles desde mais ou menos 2018 tenho a opção de trocar a língua da legenda a qualquer momento e isso acaba ajudando. Geralmente quando noto que há algo errado a primeira coisa que eu faço é conferir a tradução para o espanhol, depois a para o inglês. Algumas vezes confiro italiano, alemão e francês também pois, mesmo que eu não sabia quase nada das duas, por causa de alguns cognatos, eles acabam ajudando.

Essa postagem está ficando grande demais, vou terminar ela aqui. Até semana que vem!

4 comentários

Douglas Onofre

O fato do japonês ser uma linguagem que deve boa parte do seu entendimento ao contexto que a frase está inserida acaba gerando traduções bem engraçadas mesmo. Quando eu li os erros das traduções que você postou, ri bastante. Se existisse uma página que reunisse as piores traduções de fansubs, com certeza seria um dos meus entretenimentos diários.

Ótimo post!

qgustavor

Gostei dessa ideia. Estou planejando fazer uma série de postagens envolvendo fansubs, que vai demorar alguns meses para ficar pronta, mesmo assim vou considerar essa ideia e tentar colocar isso. Digo tentar porque, como já faz mais de um ano desde que reduzi muito a quantidade de animes que assisto por fansubs, a quantidade de erros que ainda não publiquei reduziu muito.

Talvez vou precisar de assistir alguns, o problema é escolher quais: é difícil para mim assistir de quem não corrige e me anima assistir de quem corrige. Gintama, por exemplo: achei uma centena de erros na CR, eles já corrigiram a maioria deles, ao mesmo tempo achei uns cinquenta na Hacchi, mas duvido que um dia eles irão corrigir eles, já que o grupo é dado como morto. Nem mesmo se eu corrigisse o anime para eles - como fiz com essa fansub e outras - acho que eles publicariam as minhas correções. Isso me desanima.

(Ah - ainda não implementei todo o sistema de comentários - se quiser me responder basta responder o próprio comentário e vai aparecer embaixo.)

Douglas Onofre

Estava lendo os posts anteriores ( li todos os de 2020 em ordem cronológica, claro ) e me veio uma dúvida: Apesar da imagem embutida na post “Problemas eternos”, por que seus posts não têm imagens, mas sim links para elas no Imgur? É algum problema da Framework que você está usando para esse blog?

É muito imprático para mim, como leitor, ter que abrir várias abas só para ver cada imagem.

qgustavor

Eu escrevo minhas postagens no Google Documentos e um script faz a conversão e upload das postagens no GitHub do blog. Esse script faz o upload das imagens tanto no imgur quanto no Cloudinary (caso o imgur esteja bugado).

No caso desta postagem decidi colocar os links das imagens porque, em alguns casos, são os links das imagens que (espero) que foram recebidas pelas fansubs que traduziram, para que elas corrigissem. Colocando os links é possível para ver as datas das imagens. Aquele erro do Google Translate, por exemplo, é de 2017 e nunca foi corrigido. Geralmente quando eu reporto erros para fansubs ao invés de corrigir o problema eles apagam o anime: acabei de visitar o site da fansub e o anime não estava lá. Isso, para mim, é um bom sinal: significa que o grupo recebeu as imagens que enviei. Por outro lado acho ruim que não tenham corrigido.

Um outro pronto é que para mim as imagens não eram o foco da postagem, então preferi tirar um pouco a praticidade para não encher muito a postagem. Se me lembro bem eu escrevi ela poucos dias depois de uma conversa que eu tive sobre redes neurais sendo usadas para traduzir animes. Resolvi transformar essa conversa em uma postagem, sendo esse o foco principal, não os erros.

Os erros podem ser o foco de outra postagem, daqui uns quatro meses.

Deixe um comentário