Notebookcheck Logo

Pyramid Flow, générateur de vidéos IA open source, désormais disponible en ligne

Extrait d'un court métrage texte-vidéo créé à l'aide de Pyramid Flow (Source de l'image : Pyramid Flow sur GitHub)
Extrait d'un court métrage texte-vidéo créé à l'aide de Pyramid Flow (Source de l'image : Pyramid Flow sur GitHub)
Originaire de Chine, Pyramid Flow est un modèle d'IA open-source capable de créer des vidéos virtuelles en haute résolution (768p). Selon l'équipe qui en est à l'origine, ce modèle peut générer une vidéo de cinq secondes en 384p en moins d'une minute. La licence MIT couvre Pyramid Flow, qui a été entraîné sur des ensembles de données libres.

Déjà très populaire dans les vidéos tutorielles de YouTubepyramid Flow est un nouveau modèle d'IA qui a été entraîné sur des ensembles de données libres, qui totalisent environ 10 millions de vidéos. Fruit du travail d'une équipe réunissant des chercheurs en IA de l'université de Pékin, de Kuaishou Technology et de l'université des postes et télécommunications de Pékin, Pyramid Flow est lui-même open-source. Couvert par les termes de la licence MIT ( ), il peut générer des images virtuelles en haute résolutionil peut générer des contenus vidéo virtuels en haute résolution (768p), et il se distingue manifestement lorsqu'il s'agit de 384p. Selon ses créateurs, il peut produire une vidéo de cinq secondes en moins d'une minute (en utilisant le GPU A100 dans une configuration matérielle non divulguée, apparemment).

Dans certains scénarios, Pyramid Flow excelle. En revanche, lorsqu'il s'agit de certaines invites textuelles, les résultats sont loin d'être satisfaisants. Comme c'est toujours le cas avec de nombreuses applications d'IA générative, le travail avec un tel outil s'accompagne d'une certaine dose d'aléatoire. Le bon côté des choses, c'est que l'approche de ce modèle utilise beaucoup moins de puissance de calcul que ses concurrents et que, comme son code est libre, il peut être utilisé dans des applications locales ou en nuage par les personnes intéressées sans avoir à se préoccuper de la question des licences.

Toutefois, les chercheurs en IA qui ont créé Pyramid Flow ont énuméré tous les ensembles de données utilisés pour l'entraîner, mais n'ont rien dit des problèmes de droits d'auteur qui pourraient se poser. Alors que certains créateurs de contenu affirment que les vidéos virtuelles réalisées à partir de matériel libre violent les droits des détenteurs de droits d'auteur, Pyramid Flow pourrait s'avérer utile pour peaufiner ce type de contenu sans avoir à impliquer de tierces parties.

Les personnes intéressées par l'IA du point de vue des logiciels libres peuvent se procurer Open-Source AI : The Future of Data Research de J.D. TjonWolf sur Amazon au prix de 9,99 dollars (Kindle) ou 12,99 dollars (livre de poche).

Source(s)

Please share our article, every link counts!
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2024 10 > Pyramid Flow, générateur de vidéos IA open source, désormais disponible en ligne
Codrut Nistor, 2024-10-15 (Update: 2024-10-15)