Notebookcheck Logo

OpenAI présente la capacité de son moteur vocal à cloner de manière convaincante la voix d'une personne à l'aide d'un échantillon de voix de 15 secondes

OpenAI démontre les capacités de son moteur vocal qui peut cloner la voix d'une personne à partir d'un échantillon de 15 secondes. (Image IA Dall-E 3)
OpenAI démontre les capacités de son moteur vocal qui peut cloner la voix d'une personne à partir d'un échantillon de 15 secondes. (Image IA Dall-E 3)
OpenAI a présenté en avant-première la capacité de sa technologie Voice Engine à cloner de manière convaincante la voix d'une personne à partir d'un échantillon vocal de 15 secondes. Le moteur peut également transférer l'accent d'une personne dans d'autres langues parlées lors de la traduction, prononcer un nouveau texte de manière informelle et redonner une voix claire aux personnes souffrant d'un handicap vocal ou d'une maladie.

OpenAI a présenté en avant-première l'état actuel de sa technologie Voice Engine, qui permet de cloner de manière convaincante la voix d'une personne à partir d'un échantillon vocal de 15 secondes. La technologie peut également transférer l'accent d'une personne dans d'autres langues parlées lors de la traduction, même si la langue cible utilise un langage informel ou argotique. Pour les locuteurs souffrant de troubles de la voix ou de maladies entraînant un manque de clarté, comme la laryngite, Voice Engine peut répéter ce qui a été dit d'une voix claire.

La technologie de l'IA a progressé au point de reconnaître les voyelles, les mots et d'autres parties du discours et de comprendre l'essentiel des phrases. Clonage vocal L'IA reconnaît les caractéristiques uniques du discours d'une personne, telles que l'accent, l'émotion, le rythme et l'emphase, puis utilise ces caractéristiques pour prononcer un texte sous la forme d'un clone convaincant.

OpenAI a présenté sur son blog des exemples convaincants de clonage vocal :

  • Clonage de voix
  • Traduction vocale avec clonage de l'accent vocal
  • Parler de manière informelle ou en argot
  • Parler pour les muets
  • Parler avec la voix originale et claire d'une personne souffrant de troubles de l'élocution

L'OpenAI ne met pas le moteur vocal à la disposition du public pour l'instant en raison des risques d'utilisation abusive, malgré les nombreux autres services de clonage et d'adaptation de la voix de l'IA disponibles sur le marché. Cette technologie a déjà été utilisée pendant le cycle électoral américain pour créer des appels téléphoniques "fake President Bidenet dans le monde entier pour escroquer des entreprises ( ) et des personnes ( ) et de personnes. Malheureusement, une fois que la boîte de Pandore a été ouverte, comme la technologie d'IA générative utilisée pour créer de fausses images du Papeil n'y a pas de retour en arrière possible.

Les lecteurs inquiets doivent créer des mots de sécurité avec les membres de leur famille et leurs amis proches pour vérifier leur identité, lire comment reconnaître les appels frauduleux , désactiver l'utilisation de la reconnaissance vocale pour les appels frauduleuxles lecteurs inquiets doivent créer des mots de sécurité avec les membres de leur famille et leurs amis proches pour vérifier leur identité, lire comment reconnaître les appels frauduleux, désactiver l'utilisation de la vérification par reconnaissance vocale avec les fournisseurs financiers et envisager d'utiliser un changeur de voix pour éviter que leur voix soit copiée lorsqu'ils répondent à des appelants inconnus.

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2024 03 > OpenAI présente la capacité de son moteur vocal à cloner de manière convaincante la voix d'une personne à l'aide d'un échantillon de voix de 15 secondes
David Chien, 2024-03-30 (Update: 2024-03-30)