Réunion sur l’IA dans les processus techniques AV
L’Intelligence Artificielle (IA) est un sujet omniprésent dans les médias, les conversations et les esprits; ce phénomène s’explique par le caractère novateur de cette technologie, mais plus encore par son potentiel impact disruptif sur certains métiers et organisations professionnelles. Cette réunion s’est tenue le 4 avril dernier comme un moment d’échange et de discussion afin d’évaluer la place occupée par les outils logiciels utilisant l’IA dans les processus audiovisuels (AV) des entreprises membres de la FICAM. L’IA peut être caractérisée comme un sous-domaine de l’ingénierie informatique, qui permet d’améliorer les performances et d’étendre les capacités des outils logiciels dans de très nombreux domaines, tout en défrichant de nouveaux domaines d’application créatives avec l’IA générative. Des outils logiciels utilisant l’IA (logiciel/iA) sont notoirement utilisés dans les domaines des VFX et de l’animation depuis de nombreuses années. C’est l’émergence hautement médiatisée de nouveaux outils d’IA générative comme ChatGPT ou Midjourney, qui est à l’origine de nombreuses craintes.
Le rapport intitulé “Quel impact de l’IA sur les filières du cinéma, de l’audiovisuel et du jeu vidéo?” publié récemment par le CNC distingue quatre points juridiques importants :
- transparence des données d’entraînement: des recours en justice d’ayant-droits commencent à être médiatisés; le principe de consentement de l’Opt-Out est reconnu; une recommandation de l’AI-Act européen traite de ce sujet
- quel degré de sécurité et de confidentialité des données fournies ?
- clarification des droits d’utilisation
- protection juridique des oeuvres créées
Tournages : pour la fiction, pas d’utilisation constatée d’outils intégrant l’IA pour l’indexation automatique des rushes. Un outil intégrant l’IA est utilisé pour la calibration de tracking en studio pour les décors en XR.
Postproduction : l’IA est présente dans des solutions logicielles de conversion de codage vidéo en HDR (plugin) et en upscaling (de HD vers 4k). Elle est intégrée au logiciel Resolve pour le tracking à l’image. Pour le son, elle est employée pour la réduction du bruit du signal audio. Pour la voix : quelques utilisations de voice morphing et ADR, pour générer la voix d’un chanteur connu sur l’interprétation d’un comédien; pour créer la maquette d’une voix off d’un comédien pour un son guide de montage (accord du comédien interprète de la version finale ?) ; pour simuler la voix attendue d’une post-synchronisation future, la voix synthétique étant remplacée ensuite par l’enregistrement de voix du comédien pour la version finale.
Localisation : l’IA est utilisée depuis une quinzaine d’années pour les transcriptions et traductions linguistiques destinées aux localisations de programme. Cette automatisation, complétée par une nouvelle phase de travail dite de post-édition, se traduit par des gains de productivité, baisses de coûts – rendant la localisation accessibles à de nouveaux programmes-, et sans impact négatif sur le chiffre d’affaires des prestataires. Des traductions automatiques sont parfois entraînées sur les jeux de données propriétaires. Des clients s’interrogent sur le recours au générateur de voix synthétique, et certains attendent une définition du cadre légal. Certaines entreprises font de la veille technologique, ou de la R&D, sur des solutions génératives de voix synthétiques. Actuellement, en l’absence de cadre juridique pour l’origine des données d’entraînement ou pour l’exploitation des contenus générés, les clients producteurs examinent les contrats et questionnent les prestataires sur leurs process internes (quels droits d’auteurs, RGPD, TPN…?). Des enregistrements de voix réalisés en studio peuvent être destinés à des jeux de données d’apprentissage d’IA génératives. La pratique de contrats dits full-buy-out, accordant des droits d’exploitation illimités d’un enregistrement pour le jeu vidéo et l’audiovisuel, pourrait se pratiquer dans certains pays.
adaptation/doublage : les comédiens de doublage manifestent publiquement leurs craintes face à la concurrence potentielle des systèmes d’IA générative de voix de synthèse. Une réunion exceptionnelle du Comité de Suivi du Doublage se tiendra en visio le 22 avril en présence des signataires de l’accord DADR, avec la participation d’une trentaine de représentants les parties prenantes de cette activité. Actuellement, l’IA générative de voix n’est pas utilisée pour la fiction, car la qualité d’interprétation n’est pas jugée satisfaisante par les clients. Mais les producteurs s’intéressent à la création de voix synthétiques par l’IA générative qui pourrait être un moyen d’économie. Ces solutions sont testées, et leurs progrès techniques améliorent la qualité des voix électroniques créées. Des expérimentations sont menées en doublage linguistique pour permettre la distribution de programmes dans de nouveaux pays. A l’international, des syndicats de doubleurs veulent adjoindre une mention spécifique aux contrats de cession de droit pour interdire l’utilisation des enregistrements de leur voix à des fins d’entraînement d’une IA: risque de grève des doubleurs en Espagne et Italie si des accords ne sont pas conclus avec les donneurs d’ordres. Les prestataires techniques sont tributaires, d’une part des démarches protectionnistes des comédiens, et d’autre part du souhait des producteurs d’expérimenter les solutions génératives de voix. Ils ne veulent pas être tenus pour responsables de l’usage qui est fait par leurs clients des enregistrements de voix dont ils sont commanditaires. Risque de voir arriver des nouveaux acteurs internationaux susceptibles d’exercer via internet une concurrence déloyale en s’affranchissant des obligations locales. En France, les malvoyants ne souhaitent pas que des voix synthétiques soient utilisées pour l’audio-description des programmes. Le sous-titrage SME généré par l’IA est imparfait notamment pour le respect des codes de couleurs.
Trucage image : l’IA est plus performante que la 3D pour les traitements de remplacement /vieillissement/rajeunissement de visages. Le coût du face-swapping a été divisé par 50 en 10 ans. Le rajeunissement peut être traité soit par une IA générique sans d’entraînement, soit par une IA personnalisée avec un entraînement basé sur des images historiques d’archives du comédien. Quels droits s’appliquent dans ce cas si on utilise des extraits de film ? L’IA est intégrée aux logiciels pour améliorer les fonctions de détourage automatique sur images fixes (photoshop) et animées (rotoscopie); et pour améliorer les détections et calculs des données de mouvement à l’écran (match-moving). Des prestataires s’interrogent sur leur droit d’utiliser des outils logiciels/IA VFX professionnels qui sont commercialisés alors qu’ils sont entraînés avec des données dont l’origine n’est pas déterminée. Le règlement de l’AI-Act européen va être transposé en France et imposer aux éditeurs de logiciels/IA générative de déclarer les sources de leurs jeux de données d’entraînement. Certains clients pensent que les effets visuels peuvent être fabriqués automatiquement par des outils logiciels/IA et ils voudraient minimiser les coûts des prestations fournies.
Gestion administrative/ financière/ juridique/ opérationnelle : avec l’exemple de Moviechainer, outil français de gestion financière de la chaîne de droit d’exploitation des programmes. Le CNC a autorisé l’éditeur BackUp System à utiliser des données du RCA pour entraîner l’IA de Moviechainer, qui assure la reconnaissance optique et la classification des éléments d’information figurants dans les documents contractuels.
Formation : Stéphane Bedin évoque les enjeux stratégiques de la formation professionnelle qui doit s’adapter aux nouveaux paradigmes induits par l’intégration de l’IA dans les SI de tous les secteurs d’activité. Il rappelle que dans le cadre d’un récent rapport, le gouvernement encourage une structuration de l’offre d’enseignement supérieur et une massification de la formation continue aux outils de l’IA. Dans les activités de production vidéo en temps réel comme dans la postproduction, les opérateurs sont amenés à utiliser indirectement l’IA, sous une forme intégrée dans des fonctionnalités de progiciels spécifiques, ou présente dans des plugins. Pour certains techniciens, l’accommodation à l’IA consistera à savoir libeller un prompt pour formuler son besoin avec précision.
Conclusion : la “Commission de l’Intelligence Artificielle” a rendu son rapport intitulé “l‘IA une ambition pour la France” au président de la République le 13 mars dernier. Ce rapport traduit une contradiction entre la nécessité d’ouvrir les accès aux bases de données susceptibles d’entraîner les solutions d’IA françaises, et la volonté de protéger les droits des auteurs et créateurs. Certaines de ses recommandations sont considérées comme peu concrètes. Didier Huck confirme qu’à l’occasion d’échanges avec Anne Bouverot (co-présidente de la commission), il a bien identifié un risque d’une trop forte protection légale des contenus français, risquant d’affaiblir la position de la France dans la compétition internationale qui s’annonce dans le domaine de l’IA: comment faire en sorte que les oeuvres françaises soient présentes dans les bases d’apprentissage, tout en protégeant les droits de leurs créateurs ? Une conférence internationale pourrait être organisée sur ce sujet avec la participation des mêmes spécialistes français après l’échéance de l’élection présidentielle américaine au mois de février 2025. D’autres instances de réflexion et de décisions devraient voir le jour à l’échelle nationale et à l’échelle européenne. L’observatoire de l’IA mis en place par le CNC pour le domaine des ICC audiovisuelles a vocation à poursuivre son travail. Des groupes de travail pourraient être constitués à la FICAM pour suivre les effets induits par l’émergence de l’IA dans les processus et métiers AV.