Cette avancée a été formée à l'aide d'une vaste bibliothèque de vidéos de personnes parlant , pour donner à cette IA la capacité de capturer et de reproduire les mouvements du visage et les gestes subtils tels que le clignement des yeux et la direction du regard.
Ce qui permet de transformer une simple image statique et un fragment de voix en vidéos haute définition où les avatars apparaissent parlant et gesticulant naturellement, créant même l'illusion d'une véritable conversation.
Quelles technologies VASA-1 utilise-t-il ?
La base technique derrière VASA-1 implique l'utilisation combinée d'outils d'IA avancés, en particulier StyleGAN2 et DALL·E-3. Contrairement aux êtres humains réels, les visages générés par cette technologie ne correspondent à aucune identité existante , ce que Microsoft souligne comme une mesure éthique importante.
Pour travailler, vous n'avez besoin que d'une image et d'un clip audio avec voix . Il peut ensuite produire des vidéos de 512 x 512 pixels à 45 images par seconde en mode hors ligne, tandis qu'en ligne, il atteint 40 ips avec une latence de 170 ms.
De plus, ce système permet une animation faciale détaillée qui reflète un large éventail d'émotions et de mouvements de tête , ce qui donne lieu à une représentation plus dynamique et crédible des personnalités virtuelles.
Tandis que la démonstration de Mona Lisa interprétant du rap créée par Anne Hathaway montre non seulement la capacité de l'IA à générer un contenu audiovisuel convaincant à partir d'œuvres d'art classiques, mais également son applicabilité dans d'autres domaines graphiques tels que les caricatures et les illustrations.
Pourquoi cette technologie soulève des préoccupations éthiques
Les préoccupations éthiques sont au centre de la conversation sur VASA-1 et Microsoft a pris des mesures pour limiter son accès et prévenir les mauvaises pratiques , telles que la production de vidéos deepfake qui pourraient être utilisées à des fins frauduleuses ou à des fins de désinformation.
Comme l'a annoncé la société fondée par Bill Gates, la distribution de cette technologie se fera de manière contrôlée , en se concentrant sur des applications spécifiques qui incluent la création d'assistants virtuels pour les entités gouvernementales et l'intégration dans des produits existants, tels que Windows Copilot.
Cette approche éthique reflète une préoccupation largement répandue quant aux implications de l'IA avancée, notamment en ce qui concerne les deepfakes et leur impact sur la vie privée et la réputation des personnes , un sujet d'une grande importance pour des personnalités publiques telles que Taylor Swift, victime de ces contenus malveillants.
Concernant la réglementation, bien que dix États américains aient criminalisé les deepfakes, il n’existe toujours pas de législation fédérale qui aborde spécifiquement ce problème. Cependant, plusieurs propositions ont été présentées au Congrès.
D'autre part, l'Union européenne a pris des mesures plus décisives en adoptant la loi sur l'intelligence artificielle , qui établit des mesures de protection spécifiques pour les technologies basées sur l'IA.
Microsoft et Google voient déjà les avantages de l'IA
Microsoft Corp. et Alphabet Inc., la société mère de Google, ont démontré avec leurs récents résultats financiers trimestriels que les investissements dans l'intelligence artificielle (IA) et le cloud computing génèrent des rendements importants .
Ses revenus ont dépassé les attentes de Wall Street , en grande partie grâce à l'intérêt croissant pour les solutions d'IA, ce qui a entraîné une hausse notable de ses parts de marché.
Ces résultats soulignent l’intense concurrence entre les deux géants technologiques pour devenir leader dans le domaine de l’intelligence artificielle. Microsoft collabore avec OpenA I depuis plus de deux décennies pour intensifier sa compétitivité face à la domination de Google sur le marché de la recherche Internet.
La Silicon Valley prévoit que 2024 sera l’année où l’IA générative, capable de créer du contenu à partir de simples invites, commencera à être largement déployée .