Le Firefly Video Model, comme Adobe appelle le service, sera en concurrence avec Sora, un modèle développé par OpenAI, créateur de ChatGPT, et la startup Runway, qui proposent tous deux actuellement des services de génération de vidéos. Meta Platforms, propriétaire de Facebook, a également développé un modèle d'IA pour la génération de vidéos, mais n'a pas donné de calendrier pour sa sortie.
Le modèle d'Adobe diffère de celui de ses rivaux car il vise à générer des clips qui s'intègrent dans la manière dont les studios de cinéma et de télévision utilisent Premiere Pro, son logiciel phare de montage vidéo.
À cette fin, la plupart des fonctionnalités mises en avant par Adobe consistent à introduire des plans existants dans le modèle vidéo et à lui demander de générer des clips qui corrigent ou développent des plans qui ont été pris sur un plateau de production réel mais qui ne se sont pas révélés tout à fait corrects.
Adobe a déclaré que le service générerait des clips de cinq secondes à une résolution de 1080p. Bien que ce soit plus court que les clips de 20 secondes générés par le service d'OpenAI, les dirigeants d'Adobe ont déclaré que la majorité des clips individuels dans la plupart des productions ne durent que trois secondes.
Adobe indique qu'un utilisateur peut générer 20 clips par mois pour 9,99 dollars et 70 clips pour 29,99 dollars. À titre de comparaison, le plan d'OpenAI permet de générer 50 vidéos pour 20 dollars par mois à une résolution inférieure, tandis que le plan d'OpenAI, d'une valeur de 200 dollars, permet de générer des vidéos plus longues et à plus haute résolution.
Adobe travaille également sur un plan de tarification "Premium" pour les studios et autres utilisateurs de vidéos à fort volume et publiera les détails de ces tarifs plus tard dans l'année. Alexandru Costin, vice-président d'Adobe chargé de l'IA générative, a déclaré que l'entreprise travaillait à la génération de vidéos 4K et qu'elle continuerait à se concentrer sur la qualité plutôt que sur les clips plus longs.
"Nous pensons en fait qu'un mouvement, une structure et un schéma de définition de qualité, qui donnent l'impression que le clip est un film, sont plus importants qu'un clip plus long et inutilisable", a déclaré M. Costin à l'agence Reuters. (Reportage de Stephen Nellis à San Francisco ; Montage de Sonali Paul)