Hagnýting gervigreindar, áreiðanleiki hennar og gagnanna sem hún lærir af

8. febrúar 2024

Hagnýting gervigreindar, áreiðanleiki hennar og gagnanna sem hún lærir af

Tómas Helgi Jóhannsson

Fyrr á þessu ári birtist grein eftir mig á vef Tölvumála sem bar heitið „Hagnýting gagna með hjálp ChatGPT - Gagnsemi eða skaðsemi í notkun” þar sem ég fjallaði um ákveðna áhættu af notkun ChatGPT sem velta þarf fyrir sér áður en nýting á henni hefst. Sú áhætta felst fyrst og fremst í þeirri staðreynd að viðkvæm gögn geta lekið úr gagnagrunnum yfir í stórar gervigreindir á borð við ChatGPT og í mörgum tilfellum án þess að fólk geri sér grein fyrir slíkum alvarleika. Hér verður hins vegar skoðuð önnur og alvarlegri áhætta sem skapast af óvandaðri og/eða rangri notkun gervigreindar og snýr hún að uppbyggingu, þjálfun og notkun líkana sem og að gögnunum sjálfum.

Ef við skoðum gervigreind á borð við ChatGPT, þá hefur hún að geyma ótalmörg gervigreindarlíkön sem flest snúa að textagerð sem og önnur líkön þar sem texta er breytt yfir í myndir, hljóð og myndbönd, jafnvel forritskóða svo fátt eitt sé nefnt. Þegar ChatGPT er notað er byrjað á því að setja ChatGPT í ákveðið hlutverk sem þá inniheldur tiltekinn fjölda líkana sem eru tengd saman á tiltekinn hátt til að svara þeim spurningum/beiðnum sem notandinn setur fram.

Tölfræðileg nálgun gagna
Gervigreind er í raun tölvutækni sem beitt er á tiltekið gagnamengi til að finna bestu mögulegu lausn á því vandamáli sem gagnamengið á að leysa. Þessi tækni, í sinni einföldustu mynd, byggir alfarið á tölfræðilegri nálgun gagna þar sem hver hlekkur milli tveggja eða fleiri eininda/dálka í gagnamenginu er metinn með ítrunum á hverja einustu röð í menginu og myndar að lokum gervigreindarlíkan sem hefur að geyma útreiknað stærðfræðilegt fall og/eða föll gagnanna.

Hvert líkan í gervigreind hefur það hlutverk að meta og finna bestu mögulegu lausn á því gagnamengi sem því er falið að skoða. Líkön eru oft sérhæfð og byggja á miklu magni af sérhæfðum gögnum sem safnað hefur verið saman í gagnamengi sem líkönin skilja og geta unnið með til að ná þeim árangri sem þeim er ætlað að ná. Gervigreind er í raun safn margvíslegra líkana sem tengd eru saman til að ná fram bestu mögulegu niðurstöðu á tilteknu vandamáli sem gervigreindinni og líkönum hennar er ætlað að leysa.

Þessi tölfræðilega nálgun gagna eða líkur á að tiltekið hlutmengi heildargagnamengis myndi bestu lausn og sé áreiðanlegt má í raun segja að sé ekki áreiðanlegt ef gögnin sem líkanið hefur verið þjálfað með eru í raun og veru ekki áreiðanleg. Áreiðanleiki gagnanna markast af réttleika þeirra, þ.e.a.s. að þau séu sönn og rétt skráð og að öll möguleg vensluð gögn sem skipta máli fyrir vandamálið séu til staðar með það fyrir augum að þjálfa líkönin.

Áreiðanleiki gervigreindar
Áreiðanleiki gervigreindarinnar, þ.e. hversu nákvæm hún er í að setja fram réttar niðurstöður og rétt svör við þeim spurningum sem fyrir hana eru lagðar, fer alfarið eftir áreiðanleika þeirra gagna sem líkönin hafa verið þjálfuð í. Ef áreiðanleiki og þar með gæði gagnanna er dreginn í efa með einhverjum hætti þá er áreiðanleiki gervigreindarinnar í hættu. Að sama skapi er áreiðanleiki gervigreindarinnar einnig í hættu ef gleymst hefur að taka með ákveðin gögn í þjálfuninni eða með einhverjum öðrum hætti viljandi/eða óviljandi sleppt. Áreiðanleiki gagnanna er lykilatriði í að líkönin og þá gervigreindin í heild skili þeim tilætlaða árangri sem henni er falið. Mörg nýleg dæmi hafa komið fram um að gögn sem gervigreind hefur verið þjálfuð með hafi reynst ófullnægjandi og þeim ábótavant.

Eitt dæmi sem fór á milli manna á samfélagsmiðlum nýverið, var myndband af gervigreind Teslu-bifreiðar sem ekið var fyrir framan hestvagn í umferð á sveitavegi. Gervigreindin túlkaði hestvagninn ýmist sem vöruflutningabíl, pallbíl eða pallbíl með manni fyrir aftan eða framan. Þetta er gott dæmi um að gervigreindin hafi ekki verið þjálfuð í öllum mögulegum ökutækjum sem fyrirfinnast í umferðinni víðsvegar um heiminn. Annað dæmi kemur úr háskólasamfélaginu útí heimi þar sem mastersnemi skilaði inn mastersritgerð sem innihélt mikið magn af texta sem búinn var til af ChatGPT. Við lestur ritgerðarinnar komu í ljós staðreyndavillur og staðhæfingar án tilskilins rökstuðnings og heimildaskrá ritgerðarinnar var að stórum hluta með tilvísanir í heimildir sem eru ekki til í raunveruleikanum. Þriðja dæmið kemur svo úr heilbrigðisgeiranum þar sem sýnt hefur verið fram á að gervigreindin greini mun betur krabbamein á röntgenmynd heldur en röntgenlæknir, en geti hins vegar ekki gefið nákvæma meðferðaráætlun og í mörgum tilfellum gefið beinlínis ranga og hættulega meðferðaráætlun m.v. myndgreininguna.

Fjórða dæmið er svo úr fjölmiðlaheiminum þar sem gervigreind var þjálfuð til að búa til fréttir á vefsíðu virtum erlendum netmiðil. Þar kom í ljós að gervigreindin hafði verið þjálfuð í gögnum sem byggðust á fölskum fréttum (e. fake news). Blaðamaðurinn sem beitti gervigreindinni sem og ritstjórinn sem samþykkti notkun gervigreindarinnar voru reknir.

Fimmta og síðasta dæmið er svo úr hvers kyns tal og myndvinnslu þar sem hægt er að láta gervigreindina útbúa myndir sem eiga sér enga stoð í raunveruleikanum og myndbönd af frægu fólki segja hluti og/eða haldandi fram fullyrðingum sem það myndi aldrei annars láta út úr sér fara.

Eins og sést af ofangreindum dæmum, þá er áreiðanleiki þeirra gagna sem líkön gervigreindar eru þjálfuð í gríðarlega mikilvægur þáttur. Án áreiðanleika gagnanna þá fer gervigreindin, eins og Hafsteinn Einarsson lektor við tölvunarfræði HÍ komst svo vel að orði í nýlegum fyrirlestri á málþinginu „Gervigreind, siðferði og samfélag” á vegum HÍ, landsnefndar UNESCO og Siðfræðistofnunar HÍ, „að bulla”. Við getum í raun sagt að gervigreindin sé hreint og klárt að ljúga ef gögnin í líkana-þjálfuninni eru óáreiðanleg og/eða ónákvæm.

Að ljúga með hjálp gervigreindar
Árið 1954 kom út bókin: „Hvernig á að ljúga með tölfræði” eða á frummálinu „How to lie with Statistics” eftir Darrel Huff þar sem hann fjallar um það, í máli og myndum, hvernig hægt sé að misnota og/eða misbeita tölfræði og skekkju í gögnum og þannig ranglega túlka niðurstöður sér eða einhverjum í hag og hvernig skekkja í gögnum geti framkallað rangar ályktanir. Í gegnum tíðina hefur sú misbeiting verið notuð til að afvegaleiða og/eða ná einhverju tilteknu fram af ýmsum aðilum á heimsvísu, oft á tíðum á kostnað annarra þeim að ósekju. Á hinn bóginn má segja að tölfræðin ljúgi aldrei, en sú fullyrðing er bæði rétt og röng eftir því hvernig maður lítur á hlutina, þ.e.a.s. gögnin sjálf. En allt snýst þetta um gögnin sem verið er að vinna með þá stundina. Ef mikilvægum gögnum er sleppt úr tölfræðinni, sem á að svara tilteknum spurningum, þá má líta sem svo á að niðurstöðurnar séu of hlutdrægar og þannig svari spurningunum á einsleitan hátt og þar með skekkir umtalsvert hina raunverulegu sýn á hlutina. Eins er mikilvægt að myndræn framsetning á tölfræðilegum gögnum sé rétt framsett til að það sé ekki mistúlkað á annan hátt en gögnin sjálf sýna.

Þar sem gervigreindin byggir alfarið á tölfræðilegri nálgun gagna eins og fyrr segir er gríðarlega mikilvægt að gögnin séu rétt, áreiðanleg og engum gögnum gleymt og/eða sleppt til að líkönin læri og túlki þau rétt að, öðrum kosti eru þau hreinlega að ljúga eða bulla eins og Hafsteinn komst svo skemmtilega að orði eins og fyrr sagði.

Lokaorð
Þegar opnað er fyrir almenning að gervigreind á borð við ChatGPT er vert að spyrja sig hvort það sé áhættunnar virði að Pétur og Páll geti sett hvaða gögn sem er inni í gervigreindina, án þess að réttleiki þeirra sé kannaður, þar sem gervigreindin notar þau gögn sem hún fær til að ítra líkönin sín og bæta við þekkingu sína. Eins og ofangreind dæmi sýna þá er réttleiki og gæði gagnanna gríðarlega mikilvægur þáttur í að trúverðugleiki gervigreindarinnar sé ekki dreginn í efa. Gervigreind sem slík er gríðarlega öflug tækni til að nota við að aðstoða við lausn á alls kyns vandamálum en gögnin þurfa að vera trúverðug, örugg og endurspegla alla mögulega þætti sem viðkoma vandamálinu til að áreiðanleiki og trúverðugleiki niðurstaða hjá gervigreindinni sé ekki dreginn í efa. Því að ef gögnin eru ófullnægjandi á einhvern hátt, líkt og hér hefur verið dreypt á, þá eru miklar líkur á að þjálfun sem og endurþjálfun líkananna leiði til óáreiðanlegra líkana og þar með gervigreind sem hreinlega „bullar”.

Höfundur: Tómas Helgi Jóhannsson, tölvunarfræðingur og gagnagrunnstjóri hjá Reiknistofu bankanna og situr í stjórn faghóps Ský um Hagnýtingu gagna.

Skoðað: 447 sinnum

Blaðið Tölvumál

Eldri tölublöð

Skil á efni

Til greinahöfunda

Til auglýsenda

Leita í vefútgáfu Tölvumála

Um Tölvumál

Tölvumál - tímarit Skýrslutæknifélags Íslands er óháð tímarit um tölvutækni og hefur verið gefið út frá árinu 1976.

Vefútgáfa Tölvumála birtir vikulega nýja grein á vef Ský og árlega er gefið út veglegt prentað tímarit undir nafninu "Tölvumál" þar sem fjallað er um tölvutækni frá ýmsum sjónarhornum og er þema blaðsins jafnan valið snemma árs og útgáfa að hausti.

Ritnefnd Ský sér um að afla efni í Tölvumál og geta allir sem áhuga hafa sent inn efni.

Um ritnefnd Tölvumála