Sora : La technologie de conversion de texte en vidéo d’OpenAI fait peur ! [VIDÉO]

TECH NEWS – La société connue pour Dall-E et ChatGPT a dévoilé une nouvelle technologie.

 

Selon OpenAI, Sora constituera la base d’un modèle capable de comprendre et de simuler le monde réel, rapprochant ainsi l’entreprise de l’AGI (intelligence générale artificielle). Il peut créer des enregistrements de 60 secondes avec des commandes telles que “une femme élégante marchant dans une rue de Tokyo” ou “une bande-annonce de film présentant les aventures de l’astronaute de 30 ans portant un casque de moto en laine rouge”.

Les précédentes IA génératrices de vidéos n’étaient pas très cohérentes, car les visages, les objets et les vêtements peuvent varier d’une image à l’autre. En revanche, OpenAI affirme que Sora comprend non seulement ce que l’utilisateur a écrit dans sa requête, mais également comment ces choses existent dans le monde physique. Dans le cas de la vidéo célébrant le Nouvel An lunaire, il n’est pas idiot de penser au premier abord qu’elle est censée servir de fond à un documentaire et qu’elle est un véritable plan, alors que ce n’est pas le cas, et à y regarder de plus près, les proportions des personnes sont et semble trébucher.

“Le modèle actuel présente des défauts. Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et il peut ne pas comprendre certaines instances de cause à effet. Par exemple, une personne peut mordre dans un cookie. , mais le cookie peut ne pas avoir de marque de morsure par la suite. Le modèle peut également confondre les détails spatiaux d’une requête, par exemple en confondant la gauche et la droite, et peut avoir du mal à décrire avec précision les événements qui se produisent au fil du temps, comme suivre une trajectoire de caméra particulière. “, a écrit OpenAI. Sora n’est pas encore largement disponible car la société étudie les risques sociaux du modèle et travaille sur un détecteur capable de déterminer si Sora a été utilisé pour la vidéo en question.

Plusieurs artistes visuels, designers et cinéastes ont eu accès afin qu’OpenAI puisse utiliser leurs commentaires pour améliorer le modèle afin de le rendre plus utile aux professionnels de la création. D’où le modèle tire-t-il son matériel source ?

 

Forrás : PCGamer, OpenAI

 

 

 

Spread the love
Avatar photo
theGeek is here since 2019.

theGeek TV