Microsoft desenvolve un modelo capaz de clonar perfectamente a voz dunha persoa

venres, 12 de xullo do 2024 Marcus Fernández

As probas realizadas sitúan a VALL-E 2 como o primeiro modelo deste tipo capaz de suplantar perfectamente a voz humana

Nos últimos anos a síntese de voz empregando técnicas de aprendizaxe profundo crearon unha forte preocupación, xa que fan moi doada a suplantación de identidade, e precisamente por iso é moi rechamante o proxecto de modelo de linguaxe para a síntese de voz VALL-E de Microsoft, desenvolvido para a xeración de voz en base a texto, que no deu codec neural VALL-E 2 conseguiu un fito importante: conseguir paridade humana por primeira vez, ou sexa, que consegue xerar narracións coa mesma voz que o falante orixinal do que aprende o sistema, tanto en naturalidade como en precisión.
Curiosamente dende Microsoft recoñecen que VALL-E 2 é un proxecto de investigación sen plans para incorporalo a ningún produto ou facelo de acceso público. Consideran que podería ser unha ferramenta moi útil para usos educativos, de lecer, xornalísticos, para a creación de contidos propios, para traducións... pero cun risco moi grande de cara a abusos como a suplantación de identidade, polo que no caso de que no futuro queiran ofrecer esta tecnoloxía dalgún xeito propoñen a creación de protocolos que poidan garantir a autorización do usuario para a clonación da súa voz.