A Microsoft revelou uma nova ferramenta de inteligência artificial de sincronização labial que transforma uma imagem estática do rosto de uma pessoa em um clipe animado dela falando ou cantando. VASA-1 não só é capaz de produzir movimentos labiais primorosamente sincronizado” com o áudio, mas também pode capturar um amplo espectro de nuances faciais e movimentos naturais da cabeça que contribuem para a percepção de autenticidade e vivacidade. |
A Microsoft desenvolveu uma dinâmica facial holística e um modelo de geração de movimentos da cabeça que funciona em um espaço facial latente. A empresa afirma que supera significativamente os métodos anteriores de forma abrangente.
Atualmente, o VASA é apenas uma demonstração de pesquisa, sem planos de lançar o produto ou permitir que outros usem a API; essencialmente, a Microsoft só quer mostrar seu modelo de sincronização labial.
A empresa afirma que o VASA aceitará solicitações como para onde o personagem deve olhar, o corte na cabeça do sujeito e suas emoções ao falar, que incluem neutro, feliz, zangado ou surpreso.
A Microsoft demonstrou o VASA usando DALL-E 3 ou StyleGAN2 para gerar imagens de pessoas com IA, mas fotografias reais poderiam ser usadas; as pessoas, por exemplo, poderiam ser obrigadas a falar algo que não disseram, levantando questões éticas em torno de deepfakes e desinformação.
- "Nossa pesquisa se concentra na geração de habilidades visuais afetivas para avatares virtuais de IA, visando aplicações positivas", afirma a Microsoft na página de pesquisa VASA-1. - "Não se destina a criar conteúdo usado para enganar. No entanto, como outras técnicas de geração de conteúdo relacionadas, ainda pode ser potencialmente utilizada indevidamente para se passar por humanos."
A empresa diz ainda que se opõe a qualquer comportamento para criar conteúdos enganosos ou prejudiciais de pessoas reais e que está interessada em aplicar sua técnica para avançar na detecção de falsificações.
Atualmente, os vídeos gerados por este método ainda contêm artefatos identificáveis, e a análise numérica mostra que ainda há uma lacuna para alcançar a autenticidade dos vídeos reais.
Os exemplos postados pela Microsoft ainda têm um toque de "vale da estranheza". Mas nem todo mundo é tão versado em mídia e há pessoas por aí que acreditariam que um vídeo do VASA-1 é real.
O MDig precisa de sua ajuda.
Por favor, apóie o MDig com o valor que você puder e isso leva apenas um minuto. Obrigado!
Meios de fazer a sua contribuição:
- Faça um doação pelo Paypal clicando no seguinte link: Apoiar o MDig.
- Seja nosso patrão no Patreon clicando no seguinte link: Patreon do MDig.
- Pix MDig ID: c048e5ac-0172-45ed-b26a-910f9f4b1d0a
- Depósito direto em conta corrente do Banco do Brasil: Agência: 3543-2 / Conta corrente: 17364-9
- Depósito direto em conta corrente da Caixa Econômica: Agência: 1637 / Conta corrente: 000835148057-4 / Operação: 1288
Faça o seu comentário
Comentários
Esse zóio de peixe morto ainda não engana totalmente, mas é impressionante aonde estamos chegando, e provavelmente não será bom.