A Meta anunciou na última sexta-feira (16) que está desenvolvendo uma inteligência artificial capaz de criar gravações de voz a partir de texto, editar áudios, imitar a voz de usuários e até permitir que uma pessoa fale em outros idiomas.
A novidade, chamada de Voicebox, está em estágio experimental e, por enquanto, não pode ser utilizada pelo público geral.
Uma das principais tarefas que a inteligência artificial consegue executar é permitir que uma pessoa fale em outro idioma com a própria voz. Para isso, o Voicebox processa um áudio do usuário e cria uma voz artificial muito similar à original, permitindo que ela leia textos em seis idiomas (inglês, francês, alemão, espanhol, polonês e português).
Além de falar em outros idiomas, as vozes artificiais permitem mais acessibilidade. Um usuário com deficiência visual, por exemplo, pode ouvir mensagens escritas de seus amigos e familiares com vozes que imitam essas pessoas, ao invés de ouvi-las em vozes completamente artificiais, como as dos assistentes virtuais.
Neste aspecto, o recurso é bastante similar ao Personal Voice, anunciado pela Apple em maio . A novidade vai permitir que usuários de iPhones e iPads criem vozes artificiais idênticas às suas.
Indo além
Além de imitar usuários, o Voicebox da Meta também tem outras funções bastante interessantes. A inteligência artificial pode ajudar criadores de conteúdo a editarem áudios.
O sistema consegue, por exemplo, identificar ruídos em um áudio (como buzina ou latido de cachorro), removê-los e substituir o trecho gravado por uma voz idêntica à original, sem a necessidade de regravações.
“No futuro, os modelos de inteligência artificial generativa multiuso, como o Voicebox, poderão fornecer vozes com som natural a assistentes virtuais e personagens não-jogáveis no metaverso”, afirma a Meta.
Fonte: Tecnologia