Corgarashu - stock.adobe.com

Copilot et la propriété intellectuelle : Microsoft veut rassurer ses clients

Dès le 1ᵉʳ octobre 2023, Microsoft s’engage à protéger légalement les clients de ses fonctionnalités Copilot accusés de plagiat ou de violation de droits de propriété ou d’auteur liés aux produits. Certains analystes IT voient là une « étape importante », tandis que des spécialistes du droit observent une « bonne opération de communication ».

Clairement, Microsoft mise beaucoup sur la marque ombrelle Copilot. Elle rassemble les services du géant du cloud propulsés à l’IA générative. Le premier d’entre eux n’est autre que GitHub Copilot, l’outil de génération et de complétion de code bâti sur Codex, un modèle d’IA entraîné par OpenAI. Dans cette gamme, il y a également des assistants de rédaction, d’analyse de données et de création de visuels incorporés dans la suite Microsoft 365.

La plupart des modèles infusés dans ces produits ont été entraînés à partir de données accessibles publiquement, téléchargées depuis le web. La majorité des contenus proviennent de sources libres de droits ou sous licences open source. Malgré tout, OpenAI et Microsoft n’ont pas forcément réclamé l’autorisation explicite des auteurs avant de les exploiter. GitHub et Microsoft font d’ailleurs l’objet de plaintes soumises à plusieurs cours de district aux États-Unis.

Dans un avis consultatif rendu en 2020, OpenAI défendait auprès de l’USPTO (l’équivalent américain de l’INPI) que l’utilisation des données publiques dans l’entraînement d’IA générative relevait du « fair use ». De son côté, l’USPTO, rappelle que cette loi américaine s’applique au cas par cas, mais qu’elle suffisait généralement à statuer de l’équité de l’usage de contenus lors de l’entraînement d’une IA, même s’ils peuvent être protégés par une forme de copyright.

De sérieux doutes subsistent. Le 30 août, l’US Copyright Office a lancé une enquête publique concernant les copyrights et l’IA. Un sujet qui pose de nombreuses questions, selon l’Administration. « Ces questions portent notamment sur l’utilisation d’œuvres protégées par le droit d’auteur pour entraîner des modèles d’IA, les niveaux appropriés de transparence et de divulgation en ce qui concerne l’utilisation d’œuvres protégées par le droit d’auteur, le statut juridique des résultats générés par l’IA et le traitement approprié des résultats générés par l’IA qui imitent les attributs personnels d’artistes humains ». L’USPTO entend soutenir l’initiative.

Protéger les clients des solutions Copilot

Microsoft n’attendra pas l’avis consultatif de l’US Copyright Office.

Si un tiers porte plainte contre les entreprises et les individus qui paient la souscription de ses produits propulsés à l’IA générative, Microsoft prendra leur défense.

« Nous défendrons le client et paierons le montant réclamé lors d’un jugement ou d’un arrangement défavorable », écrivent à quatre mains Brad Smith, président de Microsoft, et Hossein Nowbar, CVP et Chief Legal Officer chez Microsoft.

Pour l’heure, cela concerne particulièrement les utilisateurs payants de Bing Chat Enterprise, Microsoft 365 Copilot, Windows Copilot, Dynamics 365 Copilot, GitHub Copilot ainsi que des versions de Copilot infusées dans Power BI, Power Platform, Viva Sales et Microsoft Security.

Microsoft précise qu’il couvrira ses clients lorsqu’ils feront l’objet de « réclamations de tiers, fondées sur les droits d’auteur, les brevets, les marques, les secrets commerciaux ou le droit de publicité ».

Des conditions sine qua non

Il y a toutefois une condition à laquelle les clients devront se plier pour bénéficier de cette protection. Le géant du cloud les aidera « tant qu’ils utilisent les garde-fous et les filtres de contenu intégrés dans les produits ».

« Nous avons intégré des filtres et d’autres technologies conçus pour réduire la probabilité que les assistants Copilot renvoient des contenus illicites. »
Brad Smith et Hossein NowbarMicrosoft

« Nous avons intégré des filtres et d’autres technologies conçus pour réduire la probabilité que les assistants Copilot renvoient des contenus illicites », expliquent les dirigeants.

Ceux-là reposent « sur un large éventail de garde-fous tels que les classificateurs, les métaprompts, le filtrage de contenu, la surveillance opérationnelle et la détection des abus, y compris ceux qui sont susceptibles d’enfreindre le contenu de tiers », poursuivent-ils.

« Notre nouvel engagement Copilot en matière de copyrights exige que les clients utilisent ces technologies, ce qui incite tout le monde à mieux respecter les droits d’auteurs ».

Pour être valable, la demande devra concerner du contenu en sortie de Copilot qui n’a pas été modifié après coup, et dont le client savait qu’il ne porterait pas atteinte aux droits d’autrui. Ainsi, les données en entrées ne doivent pas contenir d’éléments protégés par des copyrights.

Sans surprise, les réclamations concernant l’utilisation de marques, la diffamation et la génération de contenus illicites ne feront pas l’objet d’un soutien de la part de Microsoft.

Le géant technologique s’engage à ne pas réclamer la propriété des données en sortie de ses services Copilot. « Cela dit, nous ne nous prononçons pas sur la question de savoir si les résultats d’un client sont protégés par des droits d’auteur ou s’ils sont opposables à d’autres utilisateurs », poursuit Microsoft dans une FAQ. « En effet, les systèmes d’IA générative peuvent produire des réponses similaires à des invites ou des requêtes semblables provenant de plusieurs clients. Par conséquent, des clients pourraient revendiquer des droits sur un contenu identique ou substantiellement analogue ».

Une « étape importante » dans l’industrie, selon des analystes de Gartner

Sur X (ex-Twitter), certains regrettent que Microsoft ne prenne cet engagement que pour ses grands clients.

Dans une discussion sur LinkedIn, les analystes de Gartner observent un engagement fort et se demandent si d’autres éditeurs et fournisseurs suivront.

« Une étape importante ! », s’exclame Jan Cook, Analyste, responsable de recherche SAP et ServiceNow chez Gartner. « Voyons si Salesforce et ServiceNow prévoient un engagement similaire ».

Pour sa part, Jason Wong, un autre analyste chez Gartner, rappelle qu’Adobe s’est engagé à faire de même pour les entreprises qui utiliseraient Firefly, son système de génération de visuels et de contenus marketing.

Par ailleurs, l’analyste considère que cette prise de position est « importante au regard du litige en cours autour de GitHub Copilot ».

Une arme de dissuasion massive ou un coup de communication rondement mené ?

Microsoft n’a toutefois pas précisé publiquement le périmètre juridique de sa mesure. Cet engagement n’est-il valable qu’aux États-Unis ? Les clients pourront accéder à de plus amples détails, selon Brad Smith et Hossein Nowbar.

D’après les dirigeants, c’est également un moyen d’affirmer aux auteurs et aux propriétaires d’IP que Microsoft prend la responsabilité des contenus générés par les IA qu’il pilote.

Pour autant, les dirigeants souhaiteraient que le contenu nécessaire à l’entraînement des IA génératives ne reste pas « dans les mains de quelques entreprises de telle manière que cela empêche la compétition et freine l’innovation ».

En la matière, les dirigeants n’ignorent probablement pas que la chose est plus complexe qu’il n’y parait au vu du nombre de parties prenantes et de licences, ouvertes ou non, nécessaires à la commercialisation d’un produit fini. De même, certaines industries, notamment dans le secteur audiovisuel, se montrent beaucoup plus protectrices que d’autres.

L’engagement envers les clients de Microsoft pourrait également être perçu comme une arme de dissuasion massive. Clairement, le groupe a les moyens financiers et légaux pour s’engager dans cette voie.

Pour autant, un universitaire en droits interrogé par Bloomberg pense le contraire. C’est justement parce que le risque qu’un client se retrouve en litige est faible que Microsoft peut prendre cet engagement concernant l’IA générative. Pour un autre professeur en droit, il s’agit là d’une « bonne opération de communication ». Il n’en demeure pas moins que la pression légale risque d’augmenter fortement lors des prochaines années. De son côté, Microsoft prétend que c’est l’une des raisons qui motivent son engagement.

« Au fur et à mesure que la loi évolue et rattrape la technologie, nous pouvons nous attendre à ce qu’un plus grand nombre de plaintes relatives au droit d’auteur soient déposées pour tester les contours de la loi », lit-on dans sa FAQ.

Pour approfondir sur Réglementations et Souveraineté