Plus
    ActualitésIntelligence ArtificielleMeta accusée d'utiliser des contenus piratés pour entraîner ses...

    Meta accusée d’utiliser des contenus piratés pour entraîner ses IA

    -

    Une affaire retentissante vient secouer le monde de l’IA. Des documents judiciaires déclassifiés par un tribunal californien révèlent que Meta aurait délibérément utilisé des contenus piratés pour entraîner ses modèles d’intelligence artificielle Llama, tout en tentant de dissimuler ces pratiques.

    Mark Zuckerberg en public
    Le PDG de Meta lors d’une présentation publique. La controverse sur l’utilisation de LibGen soulève des questions éthiques sur les pratiques de l’entreprise. Crédit: Chris Unger/Zuffa LLC via Getty Images

    Une course effrénée à l’IA

    Dans un mail datant d’octobre 2023, Ahmad Al-Dahle, vice-président de l’IA générative chez Meta, écrivait à un chercheur :

    « Notre objectif doit être GPT4. Nous devons apprendre à construire la frontière et gagner cette course. »

    Pour atteindre cet objectif, Meta n’aurait pas hésité à utiliser Library Genesis (LibGen), un site connu pour héberger illégalement des livres piratés. Cette décision aurait même été validée par « MZ » – probablement Mark Zuckerberg lui-même.

    Documents du procès
    Les documents juridiques révèlent que Meta aurait sciemment utilisé des contenus piratés pour l’entraînement de ses modèles IA. Source: Engadget

    Des pratiques douteuses minutieusement orchestrées

    Les documents révèlent une stratégie élaborée pour masquer l’utilisation de ces contenus piratés. Sony Theakanath, directeur produit chez Meta, détaillait dans un mail les « mesures d’atténuation » prévues :

    • Suppression des données marquées comme piratées
    • Évitement de toute mention publique de LibGen
    • Tests de sécurité pour les risques d’armes biologiques et CBRNE

    L’entreprise est allée jusqu’à supprimer systématiquement :

    • Les en-têtes de copyright
    • Les numéros ISBN
    • Les mentions « Tous droits réservés »
    • Les métadonnées compromettantes

    Une pénurie de données qui pousse aux extrêmes

    Cette affaire s’inscrit dans un contexte plus large de « mur des données » auquel se heurtent les géants de l’IA. En 2023, Meta avait déjà épuisé pratiquement toutes les sources de textes anglophones disponibles légalement. Des solutions désespérées avaient été envisagées, comme l’acquisition de Simon & Schuster ou l’embauche de contractuels africains pour résumer des livres sans autorisation.

    Le procès en cours, intenté par l’auteur Richard Kadrey et l’humoriste Sarah Silverman, pourrait avoir des répercussions majeures sur l’industrie de l’IA. Meta, comme d’autres entreprises, maintient que l’utilisation de contenus protégés pour l’entraînement d’IA relève de l' »usage équitable », une position juridique qui pourrait être sérieusement remise en question par ces révélations.

    Benjamin
    Benjaminhttps://www.technofeed.fr
    Passionné par les dernières technologies et notamment l'IA, je suis un amateur de tech curieux et enthousiaste qui explore les innovations qui façonnent notre monde numérique. Diplômé en communication digitale, je transforme ma fascination pour l'innovation technologique en récits captivants qui décryptent les avancées les plus prometteuses. Sur TechnoFeed, je m'attache à vulgariser des concepts complexes pour les rendre accessibles à tous, des passionnés de high-tech aux néophytes. Mon objectif : démystifier la technologie et montrer comment elle peut améliorer concrètement notre quotidien. Entre analyses pointues et regards humains, je vous invite à découvrir les technologies de demain à travers mes articles. Quand je ne suis pas plongé dans l'actualité tech, vous me trouverez probablement à tester de nouveaux outils SaaS, de nouvelles IA ou échanger avec des entrepreneurs passionnés. La technologie n'est pas qu'une histoire de machines, c'est avant tout une histoire d'hommes et de passion !

    Nos Dernières Actus

    Huawei au cœur d’un nouveau séisme au Parlement européen : soupçons de corruption et lobbying agressif

    Décidément, l'air est irrespirable au Parlement européen. À peine remis du choc du Qatargate, voilà que l'institution...

    Foxconn jongle avec les tarifs de Trump : un casse-tête pour Apple et Amazon ?

    Young Liu, PDG de Foxconn, le géant taïwanais de l'électronique, a récemment qualifié l'approche tarifaire du gouvernement américain de...

    David contre Goliath : Three Arrows Capital réclame 1,5 milliard de dollars à la carcasse de FTX

    Coup de théâtre dans le grand déballage post-apocalyptique de la crypto : Three Arrows Capital (3AC), le hedge fund...

    Tendances

    SoftBank investit 676 millions de dollars dans une ancienne usine Sharp pour booster son partenariat avec OpenAI au Japon

    SoftBank accélère sa stratégie d'intelligence artificielle au Japon avec l'acquisition d'une ancienne usine de panneaux LCD de Sharp pour...

    Londres veut les clés d’iCloud : Apple et les défenseurs des libertés numériques contre-attaquent

    C’est un bras de fer qui se joue à Londres, et dont l’enjeu dépasse largement les frontières du Royaume-Uni....

    Nos Guides Pratiques

    Comment fonctionne ChatGPT ? Les dessous du chatbot le plus connu

    Comment fonctionne ChatGPT ? Le guide ultime Aujourd'hui, nous plongeons...

    Que peut-on faire avec ChatGPT ? Exemples détaillés

    Que peut-on faire avec ChatGPT ? Un guide détaillé...

    A lire égalementÀ NE PAS RATER !
    Recommandés pour vous