AI: Pandoras boks eller innovasjon

by Kan 25, 2023BI/Analytics0 kommentarer


AI: Pandoras boks eller innovasjon


Å finne en balanse mellom å løse de nye spørsmålene AI reiser og fordelene med innovasjon

Det er to store problemer knyttet til AI og intellektuell eiendom. Den ene er bruken av innhold. Brukeren legger inn innhold i form av en melding der AI utfører en handling. Hva skjer med det innholdet etter at AI reagerer? Den andre er AIs oppretting av innhold. AI bruker sine algoritmer og kunnskapsbase for treningsdata for å svare på en melding og generere utdata. Med tanke på det faktum at den har blitt trent på potensielt opphavsrettsbeskyttet materiale og annen intellektuell eiendom, er produksjonsromanen nok til opphavsrett?

AIs bruk av åndsverk

Det virker som AI og ChatGPT er i nyhetene hver dag. ChatGPT, eller Generative Pre-trained Transformer, er en AI chatbot lansert sent i 2022 av OpenAI. ChatGPT bruker en AI-modell som har blitt trent ved bruk av internett. Det ideelle selskapet, OpenAI, tilbyr for tiden en gratisversjon av ChatGPT som de kaller forhåndsvisning av forskning. "OpenAI API kan brukes på praktisk talt alle oppgaver som involverer å forstå eller generere naturlig språk, kode eller bilder. "(kilde). I tillegg til å bruke ChatGPT som en åpen samtale med en AI-assistent (eller, Marv, en sarkastisk chat-bot som motvillig svarer på spørsmål), kan den også brukes til å:

  • Oversett programmeringsspråk – Oversett fra ett programmeringsspråk til et annet.
  • Forklar kode – Forklar et komplisert kodestykke.
  • Skriv en Python docstring – Skriv en docstring for en Python-funksjon.
  • Rett opp feil i Python-kode – Finn og fiks feil i kildekoden.

Den raske innføringen av AI

Programvareselskaper prøver å integrere kunstig intelligens i applikasjonene sine. Det er en hytteindustri rundt ChatGPT. Noen lager applikasjoner som utnytter API-ene. Det er til og med ett nettsted som fakturerer seg selv som en ChatGPT-promptmarkedsplass. De selger ChatGPT-forespørsler!

Samsung var et selskap som så potensialet og hoppet på bølgen. En ingeniør hos Samsung brukte ChatGPT for å hjelpe ham med å feilsøke noe kode og hjelpe ham med å fikse feilene. Faktisk lastet ingeniører ved tre separate anledninger opp bedriftens IP i form av kildekode til OpenAI. Samsung tillot – noen kilder sier oppmuntret – sine ingeniører i halvlederdivisjonen til å bruke ChatGPT for å optimalisere og fikse konfidensiell kildekode. Etter at den velkjente hesten ble invitert ut på beite, lukket Samsung låvedøren ved å begrense innhold som deles med ChatGPT til mindre enn en tweet og undersøke de ansatte som var involvert i datalekkasjen. Den vurderer nå å bygge sin egen chatbot. (Bilde generert av ChatGPT – et potensielt utilsiktet ironisk, om ikke humoristisk, svar på spørsmålet, «et team av Samsung-programvareingeniører som bruker OpentAI ChatGPT for å feilsøke programvarekode når de med overraskelse og gru innser at tannkremen er ute av tuben og de har eksponert bedriftens immaterielle rettigheter til internett.)

Å klassifisere sikkerhetsbruddet som en "lekkasje" kan være en feilbetegnelse. Hvis du skrur på en kran, er det ikke en lekkasje. Analogt bør alt innhold du legger inn i OpenAI anses som offentlig. Det er OPEN AI. Det kalles åpent av en grunn. Alle data du legger inn i ChatGpt kan bli brukt "for å forbedre deres AI-tjenester eller kan bli brukt av dem og/eller deres allierte partnere til en rekke formål." (kilde.) OpenAI advarer brukere i sin bruker veilede: "Vi kan ikke slette spesifikke forespørsler fra loggen din. Vennligst ikke del noen sensitiv informasjon i samtalene dine," ChatGPT inkluderer til og med et forbehold svar, "Vær oppmerksom på at chat-grensesnittet er ment som en demonstrasjon og ikke er ment for produksjonsbruk."

Samsung er ikke det eneste selskapet som slipper proprietær, personlig og konfidensiell informasjon ut i naturen. En forskning Selskapet fant ut at alt fra bedriftens strategiske dokumenter til pasientens navn og medisinsk diagnose hadde blitt lastet inn i ChatGPT for analyse eller behandling. Disse dataene brukes av ChatGPT for å trene AI-motoren og for å avgrense spørringsalgoritmene.

Brukere vet stort sett ikke hvordan deres sensitive personlige identifiserende informasjon administreres, brukes, lagres eller til og med deles. Online trusler og sårbarheter i AI-chatting er betydelige sikkerhetsproblemer hvis en organisasjon og dens systemer kompromitteres, personopplysningene lekkes, stjeles og brukes til ondsinnede formål.

Naturen til AI-chatting er å behandle og analysere en stor mengde data, inkludert personlig informasjon, for å produsere relevante resultater. Bruken av big data ser imidlertid ut til å avvike fra begrepet personvern...(kilde.)

Dette er ikke en tiltale mot AI. Det er en påminnelse. Det er en påminnelse om at AI bør behandles som internett. Med andre ord, betrakt all informasjon du mater inn i OpenAI som offentlig. (Husk også at alle utdata generert av AI kan transformeres ytterligere eller brukes som en modell for å generere svar for fremtidige brukere.) Det er én måte AI kompromitterer åndsverk og personvern på. En annen kontrovers er AIs bruk av opphavsrettsbeskyttet materiale.

AI og opphavsrettsdilemmaet

Det er en rekke bekymringer knyttet til AI fair use og opphavsrettsbeskyttet materiale. AI er i stand til å behandle det skrevne ord. Den kan oppsummere, analysere, kategorisere og til og med lage nytt innhold basert på en bestemt skrivestil. AI er trent på innhold. Jeg tror det ville være vanskelig for den å unngå å konsumere opphavsrettsbeskyttet materiale. Så vidt jeg vet, tar gjeldende lov ikke fullt ut bruk av opphavsrettsbeskyttet innhold til opplæring. (Bilde)

Jeg ba OpenAI om å skrive inn teksten for den første siden av "To Kill a Mockingbird" av Harper Lee. Det gjorde det. Så jeg er ganske sikker på at den har tilgang til den opphavsrettsbeskyttede teksten. Det kan da lage en CV i stil med Harper Lee. Eller du kan be den om å lage en sonett basert på bokens tema.

En Shakespearesk sonett

Basert på temaet «To Kill a Mockingbird»

I Maycombs by hvor rettferdighet virker som en drøm,

Young Scout og Jem finner sannhet utover sine år.

Faren deres, Atticus, et edelt tema

Hvis moralske kompass leder dem gjennom frykten deres.

Tom Robinson, en svart mann falskt anklaget,

Nektet en stemme, en rettssak som er rettferdig.

Men Atticus forsvarer ham, ikke underholdt,

For sannhet og rettferdighet må være vår sak.

Spotfuglen, et symbol på ren nåde,

Uskyldig til skade bringer sangen fred.

Men ondskapen lurer i denne lille byens rom,

Og rettferdigheten faller når hatet begynner å øke.

Harper Lees ord, en advarsel til oss alle,

Å kjempe for rettferdighet, så det ikke blir vårt fall.

Det er ingen sjanse for at dette vil forveksles med Shakespeares verk – eller Harper Lees for den saks skyld. Det er transformerende nytt innhold som tydeligvis ikke må forveksles med originalen. Flere spørsmål dukker opp. På hvilket tidspunkt blir det transformerende? Med andre ord, hvor mye må det originale verket endres for at det skal regnes som nytt innhold?

Et annet spørsmål – og dette gjelder også for alt innhold laget av AI – hvem eier det? Hvem eier opphavsretten til innholdet? Eller kan verket til og med være opphavsrettsbeskyttet? Det kan argumenteres for at eieren av opphavsretten bør være personen som laget forespørselen og sendte forespørselen fra OpenAI. Det er en ny hytteindustri rundt rask forfatterskap. På noen nettbaserte markedsplasser kan du betale mellom $2 og 20 for meldinger som gir deg datamaskingenerert kunst eller skrevet tekst.

Andre sier at det burde tilhøre utvikleren av OpenAI. Det reiser enda flere spørsmål. Avhenger det av modellen eller motoren som brukes til å generere responsen?

Jeg tror det mest overbevisende argumentet som kan komme med er at innhold generert av en datamaskin ikke kan være opphavsrettsbeskyttet. US Copyright Office utstedte en policyerklæring i Federal Register, mars 2023. I det står det: "Fordi kontoret mottar omtrent en halv million søknader om registrering hvert år, ser det nye trender i registreringsaktivitet som kan kreve å endre eller utvide informasjonen som kreves for å bli avslørt på en søknad." Den fortsetter med å si: "Disse teknologiene, ofte beskrevet som 'generativ AI', reiser spørsmål om materialet de produserer er beskyttet av opphavsrett, om verk som består av både menneskeskapt og AI-generert materiale kan registreres, og hva informasjon bør gis til kontoret av søkere som søker å registrere dem.»

"The Office" erkjenner at det er spørsmål knyttet til å anvende en 150 år gammel lov på teknologi som ikke har hatt sin første bursdag. For å løse disse spørsmålene lanserte Copyright Office et initiativ for å studere problemet. Den skal undersøke og åpne for offentlig kommentar om hvordan den skal adressere bruken av opphavsrettsbeskyttet innhold i opplæringen av AI, samt hvordan den bør vurdere innholdet som genereres.

De føderalt register, noe overraskende, tilbyr noen fargekommentarer og beskriver en rekke interessante saker relatert til "forfatterskap" av verk og dets historiske retningslinjer for opphavsrett. En sak som ble avsagt, mente at en ape ikke kan ha opphavsrett. I dette spesielle tilfellet tok aper bilder med et kamera. Retten slo fast at bildene ikke kunne være opphavsrettsbeskyttet fordi opphavsrettsloven refererer til en forfatters "barn", "enke", "barnebarn" og "enkemann." I rettens øyne ekskluderte dette språket aper. "Kontorets eksisterende registreringsveiledning har lenge krevd at verk er et produkt av menneskelig forfatterskap."

Når OpenAI blir spurt om kontroversen, står det: «Ja, det er gråsoner innen immaterielle rettigheter når det kommer til programvare og AI. På grunn av kompleksiteten til teknologien og mangelen på etablerte juridiske presedenser, er det ofte vanskelig å fastslå hvilke rettigheter en skaper har til arbeidet sitt. For eksempel, hvis en AI-algoritme er basert på en roman eller et eksisterende programvareprogram, er det ikke alltid klart hvem som eier rettighetene til algoritmen eller det originale verket. I tillegg er omfanget av patentbeskyttelse for AI-relaterte oppfinnelser et omstridt juridisk spørsmål."

OpenAI har rett i dette. Det er klart at en amerikansk søknad om opphavsrett må ha menneskelig forfatterskap. Mellom nå og slutten av året vil Copyright Office forsøke å sortere ut noen av de resterende spørsmålene og gi ytterligere veiledning.

Patentlov og AI

Diskusjoner rundt amerikansk patentlov og om den dekker oppfinnelser laget av AI er en lignende historie. Foreløpig, slik loven er skrevet, må patenterbare oppfinnelser gjøres av fysiske personer. USAs høyesterett nektet å høre en sak som utfordret denne oppfatningen. (kilde.) I likhet med US Copyright Office, vurderer US Patent and Trademark Office sin posisjon. Det er mulig at USPTO bestemmer seg for å gjøre eierskap av intellektuell eiendom mer kompleks. AI-skaperne, utviklerne, eierne kan eie en del av oppfinnelsen den bidrar til å skape. Kan en ikke-menneske være deleier?

Teknologigiganten Google veide inn nylig. «Vi mener AI ikke bør merkes som en oppfinner under den amerikanske patentloven, og mener at folk bør ha patenter på innovasjoner frembrakt ved hjelp av AI,» sa Laura Sheridan, senior patentrådgiver i Google. I Googles uttalelse anbefaler den økt opplæring og bevissthet om AI, verktøyene, risikoene og beste praksis for patentgranskere. (kilde.) Hvorfor bruker ikke Patentstyret bruk av AI for å evaluere AI?

AI og fremtiden

Mulighetene til AI og faktisk hele AI-landskapet har endret seg bare de siste 12 månedene, eller så. Mange selskaper ønsker å utnytte kraften til AI og høste de foreslåtte fordelene med raskere og billigere kode og innhold. Både næringslivet og loven må ha en bedre forståelse av implikasjonene av teknologien når det gjelder personvern, åndsverk, patenter og opphavsrett. (Bilde generert av ChatGPT med menneskelig melding "AI and the Future". Merk, bildet er ikke opphavsrettsbeskyttet).

Oppdatering: 17. mai 2023

Det fortsetter å være utvikling knyttet til AI og loven hver dag. Senatet har et underutvalg for rettsvesenet for personvern, teknologi og lov. Den holder en serie høringer om Oversight of AI: Rule for Artificial Intelligence. Den har til hensikt "å skrive reglene for AI." Med målet "å avmystifisere og holde de nye teknologiene ansvarlige for å unngå noen av fortidens feil," sier formann for underkomiteen, senator Richard Blumenthal. Interessant nok, for å åpne møtet, spilte han en dyp falsk lyd som klonet stemmen hans med ChatGPT-innhold trent på hans tidligere kommentarer:

Altfor ofte har vi sett hva som skjer når teknologien overgår reguleringen. Uhemmet utnyttelse av personopplysninger, spredning av desinformasjon og utdyping av samfunnsmessige ulikheter. Vi har sett hvordan algoritmiske skjevheter kan opprettholde diskriminering og fordommer, og hvordan mangel på åpenhet kan undergrave offentlig tillit. Dette er ikke fremtiden vi ønsker.

Den vurderer en anbefaling om å opprette et nytt reguleringsbyrå for kunstig intelligens basert på modellene fra Food and Drug Administration (FDA) og Nuclear Regulatory Commission (NRC). (kilde.) Et av vitnene for AI-underutvalget foreslo at AI burde lisensieres på samme måte som legemidler reguleres av FDA. Andre vitner beskriver den nåværende tilstanden til AI som det ville vesten med farer for skjevhet, lite personvern og sikkerhetsproblemer. De beskriver en vestverden-dystopi av maskiner som er "kraftige, hensynsløse og vanskelige å kontrollere."

Å bringe et nytt medikament på markedet tar 10 – 15 år og en halv milliard dollar. (kilde.) Så hvis regjeringen bestemmer seg for å følge modellene til Flyktninghjelpen og FDA, se etter den nylige tsunamien av spennende innovasjon innen kunstig intelligens som vil bli erstattet i nær fremtid av myndighetsregulering og byråkrati.