AI: Pandora's Box o Innovation

by Mayo 25, 2023BI/Analytics0 komento


AI: Pandora's Box o Innovation


Paghahanap ng balanse sa pagitan ng paglutas sa mga bagong tanong na itinataas ng AI at ang mga benepisyo ng pagbabago

Mayroong dalawang malaking isyu na nauugnay sa AI at intelektwal na ari-arian. Ang isa ay ang paggamit nito ng nilalaman. Ang gumagamit ay nagpasok ng nilalaman sa anyo ng isang prompt kung saan ang AI ay nagsasagawa ng ilang aksyon. Ano ang mangyayari sa content na iyon pagkatapos tumugon ang AI? Ang isa pa ay ang paglikha ng nilalaman ng AI. Ginagamit ng AI ang mga algorithm at knowledge base nito ng data ng pagsasanay upang tumugon sa isang prompt at makabuo ng output. Isinasaalang-alang ang katotohanan na ito ay sinanay sa potensyal na naka-copyright na materyal at iba pang intelektwal na ari-arian, sapat ba ang output novel sa copyright?

Ang paggamit ng AI ng intelektwal na ari-arian

Parang ang AI at ChatGPT ay nasa balita araw-araw. Ang ChatGPT, o Generative Pre-trained Transformer, ay isang AI chatbot na inilunsad noong huling bahagi ng 2022 ng OpenAI. Gumagamit ang ChatGPT ng modelong AI na sinanay gamit ang internet. Ang non-profit na kumpanya, ang OpenAI, ay kasalukuyang nag-aalok ng libreng bersyon ng ChatGPT na tinatawag nilang preview ng pananaliksik. “Maaaring ilapat ang OpenAI API sa halos anumang gawain na nagsasangkot ng pag-unawa o pagbuo ng natural na wika, code, o mga imahe. “(pinagmulan). Bilang karagdagan sa paggamit Chat GPT bilang bukas na pag-uusap kasama ang at AI assistant (o, Marv, isang mapanuksong chat bot na nag-aatubili na sumasagot sa mga tanong), maaari rin itong magamit upang:

  • Isalin ang mga programming language – Isalin mula sa isang programming language patungo sa isa pa.
  • Ipaliwanag ang code - Ipaliwanag ang isang kumplikadong piraso ng code.
  • Sumulat ng isang Python docstring - Sumulat ng isang docstring para sa isang Python function.
  • Ayusin ang mga bug sa Python code – Maghanap at ayusin ang mga bug sa source code.

Ang mabilis na pag-ampon ng AI

Ang mga kumpanya ng software ay nagsusumikap na isama ang AI sa kanilang mga aplikasyon. Mayroong cottage industry sa paligid ng ChatGPT. Ang ilan ay gumagawa ng mga application na gumagamit ng mga API nito. Mayroong kahit isang website na sinisingil ang sarili bilang a ChatGPT prompt marketplace. Nagbebenta sila ng mga prompt ng ChatGPT!

Samsung ay isang kumpanya na nakakita ng potensyal at tumalon sa bandwagon. Ginamit ng isang engineer sa Samsung ang ChatGPT para tulungan siyang i-debug ang ilang code at tulungan siyang ayusin ang mga error. Sa totoo lang, ang mga inhinyero sa tatlong magkahiwalay na okasyon ay nag-upload ng corporate IP sa anyo ng source code sa OpenAI. Pinahintulutan ng Samsung – sabi ng ilang source, hinihikayat – ang mga inhinyero nito sa semiconductor division na gumamit ng ChatGPT para i-optimize at ayusin ang kumpidensyal na source code. Matapos maimbitahan ang kasabihang kabayong iyon sa pastulan, sinara ng Samsung ang pintuan ng kamalig sa pamamagitan ng paglilimita sa nilalamang ibinahagi sa ChatGPT sa mas mababa sa isang tweet at pagsisiyasat sa mga tauhan na sangkot sa pagtagas ng data. Isinasaalang-alang na nito ngayon ang pagbuo ng sarili nitong chatbot. (Larawan na nabuo ng ChatGPT – isang potensyal na hindi sinasadyang kabalintunaan, kung hindi nakakatawa, na tugon sa prompt, "isang pangkat ng mga inhinyero ng software ng Samsung na gumagamit ng OpentAI ChatGPT upang i-debug ang software code kapag napagtanto nila nang may pagtataka at kakila-kilabot na ang toothpaste ay wala sa tubo at inilantad nila ang corporate intellectual property sa internet”.)

Ang pag-uuri sa paglabag sa seguridad bilang isang "leak" ay maaaring isang maling pangalan. Kung bubuksan mo ang isang gripo, hindi ito tumagas. Katulad nito, dapat ituring na pampubliko ang anumang nilalamang ilalagay mo sa OpenAI. Iyan ay OPEN AI. Ito ay tinatawag na bukas para sa isang dahilan. Ang anumang data na ilalagay mo sa ChatGpt ay maaaring gamitin "upang pagbutihin ang kanilang mga serbisyo ng AI o maaaring gamitin nila at/o maging ng kanilang mga kaalyadong kasosyo para sa iba't ibang layunin." (pinagmulan.) Ang OpenAI ay nagbabala sa mga user sa user nito gabayan: “Hindi namin matanggal ang mga partikular na prompt mula sa iyong kasaysayan. Mangyaring huwag magbahagi ng anumang sensitibong impormasyon sa iyong mga pag-uusap,” ang ChatGPT ay may kasamang caveat dito kasagutan, "pakitandaan na ang interface ng chat ay inilaan bilang isang pagpapakita at hindi nilayon para sa paggamit ng produksyon."

Ang Samsung ay hindi lamang ang kumpanya na naglalabas ng pagmamay-ari, personal at kumpidensyal na impormasyon sa ligaw. Isang pananaliksik kompanya nalaman na ang lahat mula sa corporate strategic na mga dokumento hanggang sa mga pangalan ng pasyente at medikal na diagnosis ay na-load sa ChatGPT para sa pagsusuri o pagproseso. Ang data na iyon ay ginagamit ng ChatGPT para sanayin ang AI engine at para pinuhin ang mga prompt algorithm.

Karamihan sa mga gumagamit ay hindi alam kung paano pinamamahalaan, ginagamit, iniimbak o ibinabahagi ang kanilang sensitibong personal na impormasyon sa pagkakakilanlan. Ang mga online na pagbabanta at kahinaan sa pakikipag-chat sa AI ay makabuluhang isyu sa seguridad kung ang isang organisasyon at ang mga system nito ay nakompromiso, ang personal na data ay na-leak, ninakaw at ginagamit para sa mga malisyosong layunin.

Ang likas na katangian ng pakikipag-chat sa AI ay upang iproseso at suriin ang isang malaking halaga ng data, kabilang ang personal na impormasyon, upang makagawa ng mga nauugnay na resulta. Gayunpaman, ang paggamit ng malaking data ay tila nag-iiba mula sa konsepto ng privacy...(pinagmulan.)

Ito ay hindi isang akusasyon ng AI. Ito ay isang paalala. Ito ay isang paalala na ang AI ay dapat tratuhin tulad ng internet. Sa madaling salita, isaalang-alang ang anumang impormasyong ipapakain mo sa OpenAI bilang pampubliko. (Tandaan din, na anumang output na nabuo ng AI ay maaaring higit pang mabago o magamit bilang isang modelo upang makabuo ng mga sagot para sa mga hinaharap na user.) Ito ay isang paraan kung saan nakompromiso ng AI ang intelektwal na ari-arian at privacy. Ang isa pang kontrobersya ay ang paggamit ng AI ng naka-copyright na materyal.

AI at ang problema sa copyright

Mayroong ilang mga alalahanin na nauugnay sa patas na paggamit ng AI at naka-copyright na materyal. Ang AI ay may kakayahang iproseso ang nakasulat na salita. Maaari itong buod, pag-aralan, ikategorya at kahit na lumikha ng bagong nilalaman batay sa isang partikular na istilo ng pagsulat. Ang AI ay sinanay sa nilalaman. Sa tingin ko ay magiging mahirap para dito na maiwasan ang pagkonsumo ng naka-copyright na materyal. Sa pagkakaalam ko, hindi ganap na tinutugunan ng kasalukuyang batas ang paggamit ng naka-copyright na nilalaman para sa pagsasanay. (Imahen)

Hiniling ko sa OpenAI na i-type ang teksto para sa unang pahina ng "To Kill a Mockingbird" ni Harper Lee. Ginawa nito. Kaya, sigurado ako na mayroon itong access sa naka-copyright na teksto. Makakagawa ito ng resume sa istilo ni Harper Lee. O, maaari mo itong hilingin na gumawa ng soneto batay sa tema ng aklat.

Isang Shakespearean Sonnet

Batay sa Tema ng "To Kill a Mockingbird"

Sa bayan ng Maycomb kung saan tila isang panaginip ang hustisya,

Ang batang Scout at Jem ay nakahanap ng katotohanan sa kabila ng kanilang mga taon.

Ang kanilang ama, si Atticus, isang marangal na tema

Kaninong moral compass ang gumagabay sa kanila sa kanilang mga takot.

Si Tom Robinson, isang itim na lalaking maling inakusahan,

Tinanggihan ang isang boses, isang pagsubok na makatarungan at patas.

Ngunit ipinagtanggol siya ni Atticus, hindi natuwa,

Para sa katotohanan at katarungan ay dapat na ating kapakanan.

Ang mockingbird, isang simbolo ng dalisay na biyaya,

Inosente ng pinsala, ang awit nito ay nagdudulot ng kapayapaan.

Ngunit ang kasamaan ay nakatago sa loob ng maliit na bayan na ito,

At bumabagsak ang hustisya habang nagsisimulang dumami ang poot.

Ang mga salita ni Harper Lee, isang babala sa ating lahat,

Upang ipaglaban ang hustisya, baka ito ang ating pagbagsak.

Walang pagkakataon na ito ay magkakamali sa gawa ni Shakespeare – o kay Harper Lee sa bagay na iyon. Ito ay pagbabagong bagong nilalaman na malinaw na hindi dapat ipagkamali sa orihinal. Ilang katanungan ang lumitaw. Sa anong punto ito nagiging transformational? Sa madaling salita, gaano kalaki ang kailangang baguhin ng orihinal na gawa para ito ay maituring na bagong nilalaman?

Isa pang tanong - at ito ay nalalapat nang pantay sa anumang nilalaman na nilikha ng AI - sino ang nagmamay-ari nito? Sino ang nagmamay-ari ng copyright sa nilalaman? O, maaari bang maging copyright ang gawa? Maaaring gumawa ng argumento na ang may-ari ng copyright ay dapat ang indibidwal na gumawa ng prompt at gumawa ng kahilingan ng OpenAI. Mayroong isang bagong industriya ng maliit na bahay sa paligid ng mabilis na pag-akda. Sa ilang mga online na marketplace, maaari kang magbayad sa pagitan ng $2 at 20 para sa mga prompt na magbibigay sa iyo ng computer generated art o nakasulat na text.

Sinasabi ng iba na dapat itong pag-aari ng developer ng OpenAI. Iyon ay nagtataas ng higit pang mga katanungan. Nakadepende ba ito sa modelo o makina na ginagamit upang makabuo ng tugon?

Sa tingin ko ang pinaka-nakakahimok na argumento na gagawin ay ang nilalamang nabuo ng isang computer ay hindi maaaring ma-copyright. Ang US Copyright Office ay nagbigay ng pahayag ng patakaran sa Federal Register, Marso 2023. Iyon ay, ito ay nagsasaad, "Dahil ang Tanggapan ay tumatanggap ng humigit-kumulang kalahating milyong aplikasyon para sa pagpaparehistro bawat taon, nakikita nito ang mga bagong uso sa aktibidad ng pagpaparehistro na maaaring mangailangan ng pagbabago o pagpapalawak ng impormasyong kinakailangan upang ibunyag sa isang aplikasyon." Sasabihin pa nito, “Ang mga teknolohiyang ito, na kadalasang inilalarawan bilang 'generative AI,' ay nagtataas ng mga tanong tungkol sa kung ang materyal na kanilang ginagawa ay protektado ng copyright, kung ang mga gawa na binubuo ng parehong akda ng tao at AI-generated na materyal ay maaaring mairehistro, at kung ano ang ang impormasyon ay dapat ibigay sa Opisina ng mga aplikanteng naglalayong irehistro sila."

Kinikilala ng “The Office” na may mga tanong na nauugnay sa paglalapat ng isang 150 taong gulang na batas sa teknolohiya na hindi pa nakita ang unang kaarawan nito. Upang matugunan ang mga tanong na iyon, naglunsad ang Copyright Office ng isang inisyatiba upang pag-aralan ang isyu. Ito ay magsasaliksik at bukas sa pampublikong komento sa kung paano ito dapat tugunan ang paggamit ng naka-copyright na nilalaman sa pagsasanay ng AI, gayundin, kung paano ito dapat isaalang-alang ang nilalaman na nabuo.

Ang Federal Register, medyo nakakagulat, nag-aalok ng ilang kulay na komentaryo at naglalarawan ng ilang kawili-wiling mga kaso na may kaugnayan sa "pag-akda" ng mga gawa at mga makasaysayang patakaran nito sa copyright. Ang isang kaso na hinatulan ay nagsabi na ang isang unggoy ay hindi maaaring magkaroon ng copyright. Sa partikular na kaso na ito, ang mga unggoy ay nakakuha ng mga larawan gamit ang isang camera. Ang korte ay nagpasya na ang mga larawan ay hindi maaaring ma-copyright dahil ang Copyright Act ay tumutukoy sa isang may-akda na ''mga anak,'' ''balo,'' ''apo,'' at ''balo." Sa mata ng korte, hindi kasama sa wikang ito ang mga unggoy. "Matagal nang hinihiling ng umiiral na gabay sa pagpaparehistro ng Opisina na ang mga gawa ay produkto ng pagiging may-akda ng tao."

Kapag tinanong ang OpenAI tungkol sa kontrobersya, sinasabi nito, "Oo, may mga kulay-abo na lugar ng batas sa intelektwal na ari-arian pagdating sa software at AI. Dahil sa pagiging kumplikado ng teknolohiya at ang kakulangan ng mga naitatag na legal na pamarisan, kadalasan ay mahirap matukoy kung anong mga karapatan ang isang creator sa kanilang trabaho. Halimbawa, kung ang isang algorithm ng AI ay batay sa isang nobela o isang umiiral nang software program, hindi palaging malinaw kung sino ang nagmamay-ari ng mga karapatan sa algorithm o sa orihinal na gawain. Bilang karagdagan, ang saklaw ng proteksyon ng patent para sa mga imbensyon na nauugnay sa AI ay isang pinagtatalunang legal na isyu."

Tama ang OpenAI dito. Malinaw na ang isang aplikasyon sa US para sa copyright ay dapat mayroong human authorship. Sa pagitan ngayon at katapusan ng taon, susubukan ng Copyright Office na ayusin ang ilan sa mga natitirang tanong at magbigay ng karagdagang gabay.

Batas sa Patent at AI

Ang mga talakayan tungkol sa US Patent Law at kung saklaw nito ang mga imbensyon na ginawa ng AI ay isang katulad na kuwento. Sa kasalukuyan, gaya ng nakasulat sa batas, ang mga patentable na imbensyon ay dapat gawin ng mga natural na tao. Ang Korte Suprema ng US ay tumanggi na dinggin ang isang kaso na hinamon ang paniwala na iyon. (pinagmulan.) Tulad ng US Copyright Office, sinusuri ng US Patent and Trademark Office ang posisyon nito. Posibleng magpasya ang USPTO na gawing mas kumplikado ang pagmamay-ari ng intelektwal na ari-arian. Maaaring pagmamay-ari ng mga tagalikha, developer, at may-ari ng AI ang bahagi ng imbensyon na tinutulungan nitong gawin. Maaari bang maging bahaging may-ari ang isang hindi tao?

Ang tech-giant na Google ay nagtimbang kamakailan. "'Naniniwala kami na ang AI ay hindi dapat mamarkahan bilang isang imbentor sa ilalim ng US Patent Law, at naniniwala na ang mga tao ay dapat magkaroon ng mga patent sa mga inobasyon na dulot ng tulong ng AI,' sabi ni Laura Sheridan, senior patent counsel sa Google." Sa pahayag ng Google, inirerekomenda nito ang mas mataas na pagsasanay at kamalayan sa AI, ang mga tool, ang mga panganib, at pinakamahusay na kagawian para sa mga tagasuri ng patent. (pinagmulan.) Bakit hindi pinagtibay ng Patent Office ang paggamit ng AI upang suriin ang AI?

AI at ang Hinaharap

Ang mga kakayahan ng AI at, sa katunayan, ang buong AI landscape ay nagbago sa loob lamang ng huling 12 buwan, o higit pa. Maraming kumpanya ang gustong gamitin ang kapangyarihan ng AI at anihin ang mga iminungkahing benepisyo ng mas mabilis at mas murang code at content. Ang parehong negosyo at batas ay kailangang magkaroon ng mas mahusay na pag-unawa sa mga implikasyon ng teknolohiya dahil nauugnay ito sa privacy, intelektwal na ari-arian, mga patent at copyright. (Larawan na nabuo sa pamamagitan ng ChatGPT na may human prompt "AI at ang Hinaharap". Tandaan, ang larawan ay hindi naka-copyright).

Update: Mayo 17, 2023

Mayroong patuloy na mga pag-unlad na nauugnay sa AI at sa batas araw-araw. Ang Senado ay mayroong Subcommittee ng Hudikatura sa Privacy, Teknolohiya at Batas. Nagsasagawa ito ng serye ng mga pagdinig sa Oversight of AI: Rule for Artificial Intelligence. Nilalayon nitong "isulat ang mga patakaran ng AI." Sa layuning "iwasan ang misteryo at panagutin ang mga bagong teknolohiyang iyon upang maiwasan ang ilan sa mga pagkakamali ng nakaraan," sabi ng chairman ng subcommittee, Sen. Richard Blumenthal. Kapansin-pansin, upang buksan ang pulong, nagpatugtog siya ng malalim na pekeng audio na nag-clone ng kanyang boses sa nilalamang ChatGPT na sinanay sa kanyang mga naunang pangungusap:

Kadalasan, nakita natin kung ano ang nangyayari kapag ang teknolohiya ay lumampas sa regulasyon. Ang walang pigil na pagsasamantala sa personal na data, ang paglaganap ng disinformation, at ang paglalim ng hindi pagkakapantay-pantay ng lipunan. Nakita namin kung paano maaaring ipagpatuloy ng mga algorithmic bias ang diskriminasyon at pagkiling at kung paano masisira ng kawalan ng transparency ang tiwala ng publiko. Hindi ito ang hinaharap na gusto natin.

Isinasaalang-alang ang isang rekomendasyon upang lumikha ng isang bagong Artificial Intelligence Regulatory Agency batay sa Food and Drug Administration (FDA) at mga modelo ng Nuclear Regulatory Commission (NRC). (pinagmulan.) Iminungkahi ng isa sa mga testigo bago ang AI subcommittee na ang AI ay dapat lisensyado nang katulad ng kung paano kinokontrol ng FDA ang mga gamot. Inilalarawan ng ibang mga saksi ang kasalukuyang estado ng AI bilang Wild West na may mga panganib ng bias, maliit na privacy, at mga isyu sa seguridad. Inilalarawan nila ang isang West World dystopia ng mga makina na "makapangyarihan, walang ingat at mahirap kontrolin."

Ang pagdadala ng bagong gamot sa merkado ay tumatagal ng 10 – 15 taon at kalahating bilyong dolyar. (pinagmulan.) Kaya, kung magpasya ang Gobyerno na sundin ang mga modelo ng NRC at FDA, hanapin ang kamakailang tsunami ng kapana-panabik na pagbabago sa larangan ng Artificial Intelligence na papalitan sa malapit na hinaharap ng regulasyon ng gobyerno at red tape.

BI/AnalyticsWalang Kategorya
Alisin ang Iyong Mga Insight: Isang Gabay sa Analytics Spring Cleaning

Alisin ang Iyong Mga Insight: Isang Gabay sa Analytics Spring Cleaning

Unclutter Your Insights Isang Gabay sa Analytics Spring Cleaning Nagsisimula ang bagong taon sa isang malakas na putok; Ang mga ulat sa pagtatapos ng taon ay nilikha at sinusuri, at pagkatapos ay ang lahat ay naaayos sa isang pare-parehong iskedyul ng trabaho. Habang humahaba ang mga araw at namumukadkad ang mga puno at bulaklak,...

Magbasa Pa

BI/AnalyticsWalang Kategorya
NY Style vs. Chicago Style Pizza: Isang Masarap na Debate

NY Style vs. Chicago Style Pizza: Isang Masarap na Debate

Kapag binibigyang-kasiyahan ang ating mga pananabik, ilang bagay ang maaaring karibal sa saya ng isang mainit na hiwa ng pizza. Ang debate sa pagitan ng New York-style at Chicago-style na pizza ay nagdulot ng madamdaming talakayan sa loob ng mga dekada. Ang bawat istilo ay may sariling natatanging katangian at tapat na tagahanga....

Magbasa Pa

BI/Analytics
Mga Catalog ng Analytics – Isang Rising Star sa Analytics Ecosystem

Mga Catalog ng Analytics – Isang Rising Star sa Analytics Ecosystem

Panimula Bilang Chief Technology Officer (CTO), palagi akong nagbabantay sa mga umuusbong na teknolohiya na nagbabago sa paraan ng paglapit namin sa analytics. Ang isang ganoong teknolohiya na nakakuha ng aking pansin sa nakalipas na ilang taon at may napakalaking pangako ay ang Analytics...

Magbasa Pa