A empresa chinesa Baidu desenvolveu uma inteligência artificial com poderes assustadores: ela consegue imitar qualquer voz depois de ouvir uma pessoa falando por menos de um minuto.
Não é a primeira pesquisa que tenta fazer isso. No passado, uma empresa desenvolveu uma rede neural que conseguia reproduzir a voz do presidente dos Estados Unidos Donald Trump e do ex-presidente Barack Obama a partir de algumas amostras de fala deles.
A ideia da Baidu, no entanto, não é contribuir para disseminação de notícias falsas. “Vamos muitas possíveis aplicações para essa tecnologia,” explicou Leo Zou, da equipe de comunicação da Baidu, ao Digital Trends. “Clonagem de voz pode ajudar pacientes que perderam suas vozes”, ele explicou. “Uma mãe pode configurar facilmente um leitor de livros em áudio com a própria voz dela”, citou, lembrando a possibilidade de uso da tecnologia em interfaces humano-máquinas.
Para desenvolver o sistema de voz sintética, os pesquisadores da Baidu usaram mais de 800 horas de áudio a partir de 2.400 pessoas diferentes. Com alguns trechos de áudio, eles conseguiram reproduzir a voz com precisão mais de 95% das vezes.
O estudo foi publicado no arXiv e pode ser lido na íntegra aqui (em inglês).