LeFaso.net, l'actualité Burkinabé sur le net
Proverbe du Jour : “Soyez un repère de qualité. Certaines personnes ne sont pas habituées à un environnement où on s’attend à l’excellence.” Steve jobs

Intelligence artificielle : OpenAI révèle Sora, une révolution dans la création vidéo

Publié le lundi 19 février 2024 à 12h19min

PARTAGER :                          
Intelligence artificielle : OpenAI révèle Sora, une révolution dans la création vidéo

L’organisation de recherche en intelligence artificielle (OpenAI), célèbre pour ses réalisations avec ChatGPT et Dall-E, a présenté Sora au public, son dernier bijou technologique, ce dimanche 18 février 2024. Sora est en effet, une intelligence artificielle spécialisée dans la création de vidéos. Cette annonce représente un pas de géant dans le domaine et suscite un grand enthousiasme, bien que le lancement officiel n’ait pas encore été programmé.

Alors que ChatGPT et Dall-E continuent d’impressionner dans leurs domaines respectifs, l’arrivée de Sora marque une nouvelle ère dans la génération de contenu visuel. Implémentée et présentée par OpenAI, cette solution novatrice est capable de produire des animations d’une minute en haute qualité visuelle (résolution 1080p). Et ce, rien qu’à partir de simples instructions textuelles. Dans un document technique, OpenAI explique : « Nous générons des modèles de diffusion conditionnelle de texte sur des vidéos et des images de différentes durées, résolutions et ratios d’aspect. »

S’appuyant sur la technologie des transformeurs, à la base des impressionnantes performances des LLM (modèles de langage de grande taille), Sora opère sur les éléments spatio-temporels des vidéos et sur le code latent des images. Ainsi, Sora est capable de générer des scènes complexes, avec plusieurs personnages, des mouvements spécifiques et des détails précis sur le sujet et l’arrière-plan. Le modèle comprend non seulement ce qui est demandé dans l’instruction, mais aussi comment ces éléments interagissent dans le monde réel.

Une solution pour les professionnels de la création

Malgré ses avancées remarquables, Sora présente quelques faiblesses que OpenAI reconnaît avec lucidité. Le modèle peut encore rencontrer des difficultés dans la simulation précise de certaines propriétés de scènes complexes, ainsi que dans la compréhension précise des détails spatiaux et temporels des instructions. Par exemple, il peut confondre la gauche et la droite ou avoir du mal à suivre précisément la trajectoire d’une caméra.

Concernant sa disponibilité, Sora est actuellement accessible à un nombre limité de personnes, principalement à l’équipe d’analyse des risques (red team) chargée d’évaluer les éventuelles failles. OpenAI offre également un accès à un groupe sélectionné d’artistes visuels, de designers et de cinéastes afin de recueillir des retours d’expérience et d’améliorer constamment le modèle pour qu’il réponde au mieux aux besoins des professionnels de la création. Dans un marché déjà concurrentiel, OpenAI compte bien s’imposer aux côtés de géants tels que Meta, Microsoft ou Runway dans le domaine de la génération de vidéos.

Hamed Nanéma
Lefaso.net

Source : Lemonde Informatique/Futura-sciences

PARTAGER :                              

Vos commentaires

Un message, un commentaire ?

modération a priori

Attention, votre message n’apparaîtra qu’après avoir été relu et approuvé.

Qui êtes-vous ?
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

 LeFaso TV
 Articles de la même rubrique