Skip to main content
30. mars 2023

Hagnýting gagna með hjálp ChatGPT - Gagnsemi eða skaðsemi í notkun

Tómas Helgi Jóhannsson

Tómas Helgi Jóhannsson Nýjasta og vinsælasta gervi-greindin á ballinu er ChatGPT. Hægt er að láta hana m.a. búa til allskonar texta og myndir eftir forskrift. Slíkir eru töfrar þessarar gervigreindar að nemendur eru farnir að nýta sér það til að skrifa heilu ritgerðirnar fyrir sig til að létta sér lífið. Sú notkun nemenda hefur farið þveröfugt í marga skóla með þeim afleiðingum að skólar eru farnir að banna notkun ChatGPT og/eða leita allra leiða til að koma í veg fyrir að nemendur fái háar einkunnir fyrir lítið sem ekkert vinnuframlag við ritgerðarsmíðina. 

Til að skilja það hvernig ChatGPT vinnur þá er það í sem stystu máli það að þú þarft að mata hana á ákveðnum upplýsingum sem gervigreindin nýtir til að vinna með. Eins bætir hún við því sem hún hefur áður lært áður en hún skilar þér þeirri niðurstöðu sem þú sækist eftir.
Fyrri útgáfur af ChatGPT hafa verið frekar ónákvæmar í svörum sökum ónógs gagnamagns, en nýjasta útgáfan er talsvert gáfaðri enda búin að innbyrða ógrynni af gögnum m.v. fyrri útgáfur.

Allir vilja dansa við heitustu gervi-greindina á ballinu og fleiri og fleiri fyrirtæki bjóða nú hinar og þessar tengingar við ChatGPT og þar eru hugbúnaðarfyrirtæki fremst í flokki sem bjóða öðrum hugbúnaðarhúsum ChatGPT - viðbætur við sín IDE verkfæri.

Sem tölvunarfræðingur og gagnagrunnstjóri hef ég ekki farið varhluta af þessum nýjungum í mínu umhverfi og bjóða nokkur hugbúnaðarhús sem státa af vinsælum og mjög öflugum gagnagrunns IDE umhverfum þessa vinsælu AI viðbót við sín kerfi. En flest þeirra firra sig þó lagalegri ábyrgð þegar kemur að notkun gervigreindar-viðbótarinnar, sem þú þarft að samþykkja áður en viðbótinni er skeytt við, og er það ekki af neinni lítilli ástæðu.

Þessi „litla ástæða“ er einmitt sú staðreynd hvernig AI vinnur sína vinnu. Til að geta hjálpað til við smíði fyrirspurna eða annarra gagnagrunnshluta þarf gervigreindin fullan aðgang að gagnagrunninum sem þú ert að vinna við. M.ö.o. sömu aðgangsréttindi og/eða meiri en þú sem notandi ert með til að vinna þína vinnu. Lítum á einfalt dæmi. Segjum sem svo að við höfum aðgang að heilbrigðisgagnagrunni og tengjumst honum með IDE verkfæri gæddu AI stuðningnum. Við opnum AI gluggann og spyrjum: „Sýndu mér alla sjúklinga sem hafa komið á spítalann síðastliðið ár“. Gervigreindinni er því næst falið að túlka þessa setningu yfir í SQL fyrirspurnamálið og jafnvel keyra það ef þú hefur gefið slíkt leyfi í uppsetningunni. Niðurstöðunni skilar gervigreindin í formi SQL fyrirspurnar og/eða gagna sem passa við þessa fyrirspurn.

Annað dæmi væri t.d. ef við værum með aðgang að gagnagrunni bankastofnunar og bæðum um „Sýndu mér allar færslur dagsins sem hafa þessi skilyrði ….. “

Það sem gerist á bakvið tjöldin er að gervigreindin sækir töflustrúkturinn, lýsigögn (meta-data) og/eða gögnin, allt eftir því hvað beðið er um, og geymir hjá sér og lærir af þeim til að setja fram eins vitræna niðurstöðu og mögulegt er. Þetta þýðir í raun að viðkvæmum töflustrúktur og jafnvel gögnum er lekið út úr heilbrigðis-/ banka-grunninum yfir í ChatGPT sem geymir þau þar til yfir lýkur.

Þetta er í raun ekkert annað en gagnastuldur að mínu mati og í þeim tilfellum þar sem aðgangur að gögnum er leyfður þá myndi slíkt flokkast sem brot á Persónuverndarlöggjöfinni sem og brot á GDPR löggjöfinni þar sem óviðkomandi þriðja aðila eru færð gögnin á silfurfati.

Að sama skapi er verið að vega að höfundarrétti hugbúnaðar þ.s. töflustrúktúrinn og annar kóði sem fyrirtæki vinna hörðum höndum að þróa með tilheyrandi kostnaði með því að soga hann upp í gervigreindina sem hún síðan nýtir til að smíða fyrir aðra sambærilegar lausnir á mun ódýrari hátt. Spyrja mætti líka þeirrar spurningar hver ætti höfundarréttinn að þeim hugbúnaði/kóða sem gervigreindin býr til.

Gervigreind sem slík er mjög áhugaverð og virkilega nytsamleg ef hún er nýtt á réttan hátt. En þegar heitasta gervigreindin á ballinu labbar út með skarann á eftir sér og alla heimsins þekkingu sem hún getur nýtt á þá vegu sem henni þóknast þá held ég að menn verði að setjast niður og spyrja sig þeirrar einföldu spurningar hvort það sé þess virði að fylgja þessari „greind“ í blindni.

Höfundur er tölvunarfræðingur og gagnagrunnstjóri hjá Reiknistofu bankanna og situr í stjórn faghóps Ský um hagnýtingu gagna.

Höfundur: Tómas Helgi Jóhannsson, gagnagrunnsstjóri, Reiknistofu bankanna

Skoðað: 723 sinnum

Blaðið Tölvumál

Forsíða Tölvumála

Leita í vefútgáfu Tölvumála

Um Tölvumál

Tölvumál - tímarit Skýrslutæknifélags Íslands er óháð tímarit um tölvutækni og hefur verið gefið út frá árinu 1976.

Vefútgáfa Tölvumála birtir vikulega nýja grein á vef Ský og árlega er gefið út veglegt prentað tímarit undir nafninu "Tölvumál" þar sem fjallað er um tölvutækni frá ýmsum sjónarhornum og er þema blaðsins jafnan valið snemma árs og útgáfa að hausti.

Ritnefnd Ský sér um að afla efni í Tölvumál og geta allir sem áhuga hafa sent inn efni.

Um ritnefnd Tölvumála