Pyramid Flow, générateur de vidéos IA open source, désormais disponible en ligne
Déjà très populaire dans les vidéos tutorielles de YouTubepyramid Flow est un nouveau modèle d'IA qui a été entraîné sur des ensembles de données libres, qui totalisent environ 10 millions de vidéos. Fruit du travail d'une équipe réunissant des chercheurs en IA de l'université de Pékin, de Kuaishou Technology et de l'université des postes et télécommunications de Pékin, Pyramid Flow est lui-même open-source. Couvert par les termes de la licence MIT ( ), il peut générer des images virtuelles en haute résolutionil peut générer des contenus vidéo virtuels en haute résolution (768p), et il se distingue manifestement lorsqu'il s'agit de 384p. Selon ses créateurs, il peut produire une vidéo de cinq secondes en moins d'une minute (en utilisant le GPU A100 dans une configuration matérielle non divulguée, apparemment).
Dans certains scénarios, Pyramid Flow excelle. En revanche, lorsqu'il s'agit de certaines invites textuelles, les résultats sont loin d'être satisfaisants. Comme c'est toujours le cas avec de nombreuses applications d'IA générative, le travail avec un tel outil s'accompagne d'une certaine dose d'aléatoire. Le bon côté des choses, c'est que l'approche de ce modèle utilise beaucoup moins de puissance de calcul que ses concurrents et que, comme son code est libre, il peut être utilisé dans des applications locales ou en nuage par les personnes intéressées sans avoir à se préoccuper de la question des licences.
Toutefois, les chercheurs en IA qui ont créé Pyramid Flow ont énuméré tous les ensembles de données utilisés pour l'entraîner, mais n'ont rien dit des problèmes de droits d'auteur qui pourraient se poser. Alors que certains créateurs de contenu affirment que les vidéos virtuelles réalisées à partir de matériel libre violent les droits des détenteurs de droits d'auteur, Pyramid Flow pourrait s'avérer utile pour peaufiner ce type de contenu sans avoir à impliquer de tierces parties.
Les personnes intéressées par l'IA du point de vue des logiciels libres peuvent se procurer Open-Source AI : The Future of Data Research de J.D. TjonWolf sur Amazon au prix de 9,99 dollars (Kindle) ou 12,99 dollars (livre de poche).
Source(s)
Flux pyramidal (sur GitHub, via Tech Xplore)
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs