IA : la boîte de Pandore ou l'innovation

by 25 mai 2023BI/Analytique0 commentaires


IA : la boîte de Pandore ou l'innovation


Trouver un équilibre entre la résolution des nouvelles questions que soulève l'IA et les bénéfices de l'innovation

Il y a deux énormes problèmes liés à l'IA et à la propriété intellectuelle. L'un est son utilisation du contenu. L'utilisateur saisit le contenu sous la forme d'une invite sur laquelle l'IA effectue une action. Qu'advient-il de ce contenu après la réponse de l'IA ? L'autre est la création de contenu par l'IA. L'IA utilise ses algorithmes et sa base de connaissances sur les données d'entraînement pour répondre à une invite et générer une sortie. Compte tenu du fait qu'il a été formé sur du matériel potentiellement protégé par le droit d'auteur et d'autres propriétés intellectuelles, la sortie est-elle suffisamment nouvelle pour être protégée par le droit d'auteur ?

Utilisation de la propriété intellectuelle par l'IA

Il semble que l'IA et ChatGPT fassent la une des journaux tous les jours. ChatGPT, ou Generative Pre-trained Transformer, est un chatbot IA lancé fin 2022 par OpenAI. ChatGPT utilise un modèle d'IA qui a été formé à l'aide d'Internet. La société à but non lucratif, OpenAI, propose actuellement une version gratuite de ChatGPT qu'ils appellent le aperçu de la recherche. « L'API OpenAI peut être appliquée à pratiquement toutes les tâches qui impliquent de comprendre ou de générer du langage naturel, du code ou des images. " (Identifier). En plus d'utiliser ChatGPT comme une conversation ouverte avec un assistant IA (ou, Marv, un chat bot sarcastique qui répond à contrecœur aux questions), il peut également être utilisé pour :

  • Traduire les langages de programmation - Traduire d'un langage de programmation à un autre.
  • Expliquez le code - Expliquez un morceau de code compliqué.
  • Écrire une docstring Python – Écrivez une docstring pour une fonction Python.
  • Corrigez les bogues dans le code Python – Recherchez et corrigez les bogues dans le code source.

L'adoption rapide de l'IA

Les éditeurs de logiciels s'efforcent d'intégrer l'IA dans leurs applications. Il y a une industrie artisanale autour de ChatGPT. Certains créent des applications qui exploitent ses API. Il existe même un site Web qui se présente comme un Marché d'invite ChatGPT. Ils vendent des invites ChatGPT !

Samsung était une entreprise qui a vu le potentiel et a sauté dans le train en marche. Un ingénieur de Samsung a utilisé ChatGPT pour l'aider à déboguer du code et à corriger les erreurs. En fait, les ingénieurs ont à trois reprises téléchargé la propriété intellectuelle de l'entreprise sous forme de code source sur OpenAI. Samsung a autorisé – certaines sources disent, encouragé – ses ingénieurs de la division des semi-conducteurs à utiliser ChatGPT pour optimiser et corriger le code source confidentiel. Après que ce cheval proverbial ait été invité au pâturage, Samsung a claqué la porte de la grange en limitant le contenu partagé avec ChatGPT à moins d'un tweet et en enquêtant sur le personnel impliqué dans la fuite de données. Il envisage maintenant de créer son propre chatbot. (Image générée par ChatGPT - une réponse potentiellement involontairement ironique, sinon humoristique, à l'invite, "une équipe d'ingénieurs logiciels Samsung utilisant OpentAI ChatGPT pour déboguer le code logiciel lorsqu'ils réalisent avec surprise et horreur que le dentifrice est sorti du tube et ils ont exposé la propriété intellectuelle de l'entreprise sur Internet ».)

Classer la faille de sécurité comme une « fuite » peut être un terme impropre. Si vous ouvrez un robinet, ce n'est pas une fuite. De même, tout contenu que vous entrez dans OpenAI doit être considéré comme public. C'est l'IA OUVERTE. C'est ce qu'on appelle ouvert pour une raison. Toutes les données que vous entrez dans ChatGpt peuvent être utilisées "pour améliorer leurs services d'IA ou peuvent être utilisées par eux et/ou même leurs partenaires alliés à diverses fins". (Identifier.) OpenAI avertit les utilisateurs dans son utilisateur guide: "Nous ne sommes pas en mesure de supprimer des invites spécifiques de votre historique. Veuillez ne partager aucune information sensible dans vos conversations », ChatGPT inclut même une mise en garde dans son réponses, "veuillez noter que l'interface de chat est conçue comme une démonstration et n'est pas destinée à une utilisation en production."

Samsung n'est pas la seule entreprise à divulguer des informations exclusives, personnelles et confidentielles dans la nature. Une recherche Société a constaté que tout, des documents stratégiques de l'entreprise aux noms des patients et aux diagnostics médicaux, avait été chargé dans ChatGPT pour analyse ou traitement. Ces données sont utilisées par ChatGPT pour entraîner le moteur d'IA et affiner les algorithmes d'invite.

La plupart des utilisateurs ne savent pas comment leurs informations d'identification personnelles sensibles sont gérées, utilisées, stockées ou même partagées. Les menaces et les vulnérabilités en ligne dans le chat IA sont des problèmes de sécurité importants si une organisation et ses systèmes sont compromis, les données personnelles sont divulguées, volées et utilisées à des fins malveillantes.

La nature du chat IA est de traiter et d'analyser une grande quantité de données, y compris des informations personnelles, pour produire des résultats pertinents. Cependant, l'utilisation des mégadonnées semble s'écarter de la notion de vie privée…(Identifier.)

Ce n'est pas une mise en accusation d'AI. C'est un rappel. C'est un rappel que l'IA doit être traitée comme Internet. En d'autres termes, considérez toute information que vous fournissez à OpenAI comme publique. (N'oubliez pas non plus que tout résultat généré par l'IA peut être transformé ou utilisé comme modèle pour générer des réponses pour les futurs utilisateurs.) C'est une façon dont l'IA compromet la propriété intellectuelle et la confidentialité. Une autre controverse est l'utilisation par AI de matériel protégé par le droit d'auteur.

L'IA et le dilemme du droit d'auteur

Il existe un certain nombre de préoccupations liées à l'utilisation équitable de l'IA et au matériel protégé par le droit d'auteur. L'IA est capable de traiter le mot écrit. Il peut résumer, analyser, catégoriser et même créer de nouveaux contenus basés sur un style d'écriture particulier. L'IA est formée sur le contenu. Je pense qu'il lui serait difficile d'éviter de consommer du matériel protégé par le droit d'auteur. Pour autant que je sache, la législation actuelle ne traite pas entièrement de l'utilisation de contenu protégé par le droit d'auteur à des fins de formation. (Image(s))

J'ai demandé à OpenAI de taper le texte de la première page de "To Kill a Mockingbird" de Harper Lee. Ça faisait. Donc, je suis à peu près sûr qu'il a accès au texte protégé par le droit d'auteur. Il peut alors créer un CV dans le style de Harper Lee. Ou, vous pouvez lui demander de créer un sonnet basé sur le thème du livre.

Un sonnet shakespearien

Basé sur le thème de "Tuer un oiseau moqueur"

Dans la ville de Maycomb où la justice semble un rêve,

Young Scout et Jem découvrent la vérité au-delà de leurs années.

Leur père, Atticus, un thème noble

Dont la boussole morale les guide à travers leurs peurs.

Tom Robinson, un homme noir faussement accusé,

Privé d'une voix, un procès juste et équitable.

Mais Atticus le défend, pas amusé,

Car la vérité et la justice doivent être notre affaire.

L'oiseau moqueur, symbole de pure grâce,

Innocent du mal, son chant apporte la paix.

Mais le mal se cache dans l'espace de cette petite ville,

Et la justice tombe alors que la haine commence à augmenter.

Les mots de Harper Lee, un avertissement pour nous tous,

Pour lutter pour la justice, de peur que ce ne soit notre chute.

Il n'y a aucune chance que cela soit confondu avec le travail de Shakespeare - ou de Harper Lee d'ailleurs. Il s'agit clairement d'un nouveau contenu transformationnel à ne pas confondre avec l'original. Plusieurs questions se posent. A quel moment devient-elle transformationnelle ? En d'autres termes, dans quelle mesure l'œuvre originale doit-elle être modifiée pour être considérée comme un nouveau contenu ?

Une autre question – et cela s'applique également à tout contenu créé par l'IA – à qui appartient-il ? Qui détient les droits d'auteur sur le contenu ? Ou, l'œuvre peut-elle même être protégée par le droit d'auteur ? Un argument peut être avancé que le propriétaire du droit d'auteur devrait être la personne qui a créé l'invite et fait la demande d'OpenAI. Il existe une nouvelle industrie artisanale autour de la création rapide. Sur certains marchés en ligne, vous pouvez payer entre 2 et 20 $ pour des invites qui vous permettront d'obtenir de l'art généré par ordinateur ou du texte écrit.

D'autres disent qu'il devrait appartenir au développeur d'OpenAI. Cela soulève encore plus de questions. Cela dépend-il du modèle ou du moteur utilisé pour générer la réponse ?

Je pense que l'argument le plus convaincant à faire est que le contenu généré par un ordinateur ne peut pas être protégé par le droit d'auteur. Le Bureau du droit d'auteur des États-Unis a publié une déclaration de politique dans le Registre fédéral, mars 2023. En cela, il déclare: "Parce que le Bureau reçoit environ un demi-million de demandes d'enregistrement chaque année, il voit de nouvelles tendances dans l'activité d'enregistrement qui peuvent nécessiter de modifier ou d'élargir les informations qui doivent être divulguées sur une demande." Il poursuit en disant : « Ces technologies, souvent décrites comme « IA générative », soulèvent la question de savoir si le matériel qu'elles produisent est protégé par le droit d'auteur, si les œuvres composées à la fois de matériel d'auteur humain et de matériel généré par l'IA peuvent être enregistrées, et quelles des informations doivent être fournies à l'Office par les demandeurs souhaitant les enregistrer.

"Le Bureau" reconnaît qu'il y a des questions liées à l'application d'une loi vieille de 150 ans à une technologie qui n'a pas vu son premier anniversaire. Pour répondre à ces questions, le Bureau du droit d'auteur a lancé une initiative pour étudier la question. Il va faire des recherches et s'ouvrir aux commentaires du public sur la façon dont il devrait aborder l'utilisation du contenu protégé par le droit d'auteur dans la formation de l'IA, ainsi que sur la façon dont il devrait considérer le contenu généré.

La Registre fédéral, de manière quelque peu surprenante, propose des commentaires en couleur et décrit un certain nombre de cas intéressants liés à la «paternité» des œuvres et à ses politiques historiques sur le droit d'auteur. Un cas qui a été jugé a conclu qu'un singe ne peut pas détenir un droit d'auteur. Dans ce cas particulier, des singes ont capturé des images avec un appareil photo. Le tribunal a statué que les images ne pouvaient pas être protégées par le droit d'auteur, car la loi sur le droit d'auteur fait référence aux « enfants », « veuve », « petits-enfants » et « veuf » d'un auteur. Aux yeux de la cour, ce langage excluait les singes. "Les directives d'enregistrement existantes de l'Office exigent depuis longtemps que les œuvres soient le produit d'un auteur humain."

Lorsqu'OpenAI est interrogé sur la controverse, il répond: «Oui, il existe des zones grises du droit de la propriété intellectuelle en matière de logiciels et d'IA. En raison de la complexité de la technologie et de l'absence de précédents juridiques établis, il est souvent difficile de déterminer les droits d'un créateur sur son œuvre. Par exemple, si un algorithme d'IA est basé sur un roman ou un logiciel existant, il n'est pas toujours clair qui détient les droits sur l'algorithme ou l'œuvre originale. En outre, la portée de la protection par brevet des inventions liées à l'IA est une question juridique controversée. »

OpenAI a raison sur ce point. Il est clair qu'une demande de droit d'auteur aux États-Unis doit avoir la paternité humaine. D'ici la fin de l'année, le Bureau du droit d'auteur tentera de résoudre certaines des questions restantes et de fournir des conseils supplémentaires.

Droit des brevets et IA

Les discussions autour de la loi américaine sur les brevets et de la question de savoir si elle couvre les inventions réalisées par l'IA sont une histoire similaire. Actuellement, selon la rédaction de la loi, les inventions brevetables doivent être faites par des personnes physiques. La Cour suprême des États-Unis a refusé d'entendre une affaire qui contestait cette notion. (Identifier.) Comme le US Copyright Office, le US Patent and Trademark Office évalue sa position. Il est possible que l'USPTO décide de complexifier la propriété intellectuelle. Les créateurs, développeurs et propriétaires d'IA peuvent posséder une partie de l'invention qu'ils contribuent à créer. Un non-humain pourrait-il être copropriétaire ?

Le géant de la technologie Google est intervenu récemment. "" Nous pensons que l'IA ne devrait pas être étiquetée comme un inventeur en vertu de la loi américaine sur les brevets, et pensons que les gens devraient détenir des brevets sur les innovations réalisées avec l'aide de l'IA ", a déclaré Laura Sheridan, conseillère principale en matière de brevets chez Google." Dans la déclaration de Google, il recommande une formation et une sensibilisation accrues à l'IA, aux outils, aux risques et aux meilleures pratiques pour les examinateurs de brevets. (Identifier.) Pourquoi l'Office des brevets n'adopte-t-il pas l'utilisation de l'IA pour évaluer l'IA ?

L'IA et l'avenir

Les capacités de l'IA et, en fait, l'ensemble du paysage de l'IA ont changé au cours des 12 derniers mois environ. De nombreuses entreprises souhaitent tirer parti de la puissance de l'IA et récolter les avantages proposés d'un code et d'un contenu plus rapides et moins chers. Les entreprises et la loi doivent avoir une meilleure compréhension des implications de la technologie en ce qui concerne la vie privée, la propriété intellectuelle, les brevets et le droit d'auteur. (Image générée par ChatGPT avec l'invite humaine "AI and the Future". Remarque, l'image n'est pas protégée par le droit d'auteur).

Mise à jour : 17 mai 2023

Il continue d'y avoir des développements liés à l'IA et à la loi tous les jours. Le Sénat a un sous-comité judiciaire sur la vie privée, la technologie et la loi. Il organise une série d'auditions sur la surveillance de l'IA : la règle de l'intelligence artificielle. Il entend "écrire les règles de l'IA". Dans le but de « démystifier et tenir pour responsables ces nouvelles technologies afin d'éviter certaines des erreurs du passé », déclare le président du sous-comité, le sénateur Richard Blumenthal. Fait intéressant, pour ouvrir la réunion, il a joué un faux son profond clonant sa voix avec du contenu ChatGPT formé sur ses remarques précédentes :

Trop souvent, nous avons vu ce qui se passe lorsque la technologie dépasse la réglementation. L'exploitation débridée des données personnelles, la prolifération de la désinformation et le creusement des inégalités sociétales. Nous avons vu comment les biais algorithmiques peuvent perpétuer la discrimination et les préjugés et comment le manque de transparence peut saper la confiance du public. Ce n'est pas l'avenir que nous voulons.

Il envisage une recommandation visant à créer une nouvelle agence de réglementation de l'intelligence artificielle basée sur les modèles de la Food and Drug Administration (FDA) et de la Nuclear Regulatory Commission (NRC). (Identifier.) L'un des témoins devant le sous-comité sur l'IA a suggéré que l'IA devrait être autorisée de la même manière que les produits pharmaceutiques sont réglementés par la FDA. D'autres témoins décrivent l'état actuel de l'IA comme le Far West avec des dangers de partialité, peu de confidentialité et des problèmes de sécurité. Ils décrivent une dystopie du monde occidental de machines «puissantes, imprudentes et difficiles à contrôler».

Mettre un nouveau médicament sur le marché prend 10 à 15 ans et un demi-milliard de dollars. (Identifier.) Donc, si le gouvernement décide de suivre les modèles du NRC et de la FDA, attendez-vous à ce que le récent tsunami d'innovations passionnantes dans le domaine de l'intelligence artificielle soit remplacé dans un avenir très proche par la réglementation gouvernementale et la bureaucratie.

BI/AnalytiqueAutres
Pourquoi Microsoft Excel est l'outil d'analyse n°1
Pourquoi Excel est-il l'outil d'analyse n°1 ?

Pourquoi Excel est-il l'outil d'analyse n°1 ?

  C'est bon marché et facile. Le logiciel de feuille de calcul Microsoft Excel est probablement déjà installé sur l'ordinateur de l'utilisateur professionnel. Et de nombreux utilisateurs d’aujourd’hui ont été exposés aux logiciels Microsoft Office depuis le lycée ou même avant. Cette réponse instinctive quant à...

En savoir plus

BI/AnalytiqueAutres
Désencombrez vos informations : un guide pour le nettoyage de printemps analytique

Désencombrez vos informations : un guide pour le nettoyage de printemps analytique

Désencombrez vos informations Un guide pour l'analyse du ménage de printemps La nouvelle année commence en beauté ; des rapports de fin d'année sont créés et examinés, puis tout le monde s'installe dans un horaire de travail cohérent. À mesure que les jours rallongent et que les arbres et les fleurs fleurissent,...

En savoir plus

BI/AnalytiqueAutres
NY Style vs Chicago Style Pizza : un délicieux débat

NY Style vs Chicago Style Pizza : un délicieux débat

Pour satisfaire nos envies, peu de choses peuvent rivaliser avec la joie d’une part de pizza bien chaude. Le débat entre la pizza à la new-yorkaise et la pizza à la Chicago suscite des discussions passionnées depuis des décennies. Chaque style a ses propres caractéristiques uniques et ses fans dévoués....

En savoir plus

BI/Analytique
Catalogues Analytics – Une étoile montante dans l’écosystème Analytics

Catalogues Analytics – Une étoile montante dans l’écosystème Analytics

Introduction En tant que directeur de la technologie (CTO), je suis toujours à la recherche de technologies émergentes qui transforment notre façon d'aborder l'analyse. L'une de ces technologies qui a retenu mon attention au cours des dernières années et qui est immense et prometteuse est l'Analytics...

En savoir plus