Une semaine difficile pour l’équipe de relations publiques de Meta, avec un nouveau rapport suggérant que l’entreprise aurait utilisé des logiciels de partage de fichiers en torrent pour télécharger illégalement des livres protégés par le droit d’auteur, qu’elle aurait ensuite ajoutés aux jeux de données utilisés pour entraîner ses modèles d’IA. Et Mark Zuckerberg lui-même aurait approuvé cette utilisation, malgré les réticences en interne.

Les Révélations Des Documents Judiciaires

Selon un nouveau rapport de Wired, cette révélation figurait dans le cadre d’une affaire de droit d’auteur déposée par un groupe d’auteurs contre Meta concernant le développement de ses jeux de données d’IA. Les documents publiés par le tribunal montrent que Meta a utilisé un outil appelé « Library Genesis » (LibGen) pour accéder à des versions piratées de livres afin d’aider à construire ses jeux de données.

Ces documents nouvellement non censurés révèlent des échanges entre des employés de Meta découverts lors du processus de découverte, comme un ingénieur de Meta disant à un collègue qu’il hésitait à accéder aux données de LibGen parce que « le partage de fichiers en torrent à partir d’un ordinateur portable d’entreprise [appartenant à Meta] ne semble pas correct. »

– Wired

Les documents allèguent également que les discussions internes sur l’utilisation des données de LibGen ont été portées à l’attention du PDG de Meta, Mark Zuckerberg (désigné par « MZ » dans la note remise lors de la découverte) et que l’équipe d’IA de Meta a été « autorisée à utiliser » le matériel piraté.

Une Mauvaise Publicité Pour Zuckerberg

Cette nouvelle ne fait pas bonne figure pour Zuckerberg, qui fait déjà face à un retour de bâton important suite à ses récentes décisions de plier devant le président élu Donald Trump. La semaine dernière, Meta a annoncé un remaniement majeur de son processus de modération du contenu, tout en éliminant son programme de vérification des faits, au profit d’un système de notes communautaires de style X.

Les approches de Meta sur ces deux fronts ont longtemps été critiquées par les politiciens de droite, y compris Trump, et les changements semblent s’aligner sur ce que Trump aurait pu demander à Zuckerberg lors de leur rencontre à la fin de l’année dernière, peu après sa victoire électorale.

Un Changement De Perception De Zuckerberg

Ces révélations ont rapidement transformé la perception de Zuckerberg, qui a passé des années à remodeler son image publique suite aux controverses du passé. En effet, Meta a changé le nom de son entreprise pour prendre ses distances avec des scandales comme Cambridge Analytica, dans un effort pour éviter l’association avec ses problèmes antérieurs d’accès et de gestion des données.

Zuckerberg lui-même est apparu ces derniers temps comme une présence plus accessible et plus humaine. Mais les deux dernières semaines ont apparemment révélé, une fois de plus, que Zuckerberg valorise le succès des affaires par-dessus tout, et que ses positions morales sont dictées par le profit.

Les Implications Pour Les Créateurs

Cette dernière révélation soulignera davantage ce point, montrant que Zuckerberg est potentiellement prêt à nuire aux artistes pour son propre gain commercial. Ce qui, je suppose, n’est pas une révélation majeure en fin de compte. Les PDG sont responsables de la performance de l’entreprise et sont redevables envers leurs actionnaires, il n’est donc pas très surprenant qu’ils agissent dans l’intérêt de l’entreprise.

Mais il y a aussi eu une plus grande poussée ces derniers temps pour soutenir des entreprises plus éthiques, et des révélations comme celle-ci, si elles s’avèrent exactes, pourraient avoir un impact. Mais là encore, le cycle médiatique est beaucoup plus court qu’auparavant, et les controverses ont tendance à ne durer qu’un jour ou deux, jusqu’à ce que le prochain problème du jour prenne le relais.

  • Donc peut-être que ce n’est pas un aussi grand risque qu’il n’y paraît
  • Et peut-être que Meta considère le développement éventuel d’une IA plus avancée comme plus précieux que les risques d’accéder à un seul jeu de données

L’Argument Controversé Du « Fair Use »

Après tout, Meta a déjà fait valoir que l’utilisation de tout matériel disponible publiquement pour entraîner ses outils d’IA est couverte par le « fair use », une clause de droit d’auteur qui permet une telle utilisation dans des cas spécifiques, comme les reportages d’actualité.

Cela semble être une interprétation assez scandaleuse de cette clause, mais encore une fois, l’équipe juridique de Meta a été assez audacieuse dans ses tentatives de justifier l’utilisation par l’entreprise d’énormes ensembles de données. Audacieuse, et à certains égards, arrogante, sachant qu’elle dispose des ressources nécessaires pour contrer les menaces juridiques jusqu’à l’oubli, et que les lois ne sont pas actuellement structurées pour couvrir des utilisations comme la formation de l’IA.

Conclusion

Cette approche d’intimidation peut être plus fidèle à Meta, et au style réel de Zuckerberg, ce qui sape encore une fois la personnalité plus détendue qu’il a cultivée ces dernières années. Mais au final, Zuckerberg est un capitaliste, et en ce sens, tout ce que nous voyons, c’est un homme d’affaires qui maximise ses opportunités.

Cependant, cela pourrait, à un moment donné, provoquer un retour de bâton plus important contre les produits de Meta. Seul le temps nous le dira, mais une chose est sûre : cette controverse ne fera qu’intensifier le débat déjà houleux sur l’éthique de l’utilisation des données dans le développement de l’IA.