Babel fiskur
Hitchhiker‘s Guide to the Galaxy er frægt útvarpsleikrit eftir Douglas Adams. Þar er fjallað um Englendinginn Arthur Dent sem lendir í því að þurfa að fara á puttanum út í geim eftir að jörðin er eyðilögð. Í geimnum tala menn önnur tungumál sem hann ekki skilur. Til allrar hamingju er vinur hans Ford Prefect með í för og treður litlum gulum slímugum fisk upp í eyrað á honum (BBC, 2014).
Fiskurinn sem um ræðir kallast Babel fiskur og er líklega það allra furðulegasta í öllum alheiminum. Fiskurinn nærist á heilabylgjum og dregur í sig tíðnisvið undirmeðvitundarinnar. Fiskurinn skilar svo úrgangi í formi taugaboða sem berast til málúrvinnslusvæðis í heilanum. Það að stinga svona fisk upp í eyrað hefur því í för með sér að viðkomandi skilur á örskotsstundu allt sem er sagt við hann á hvaða tungumáli sem er (BBC Studios, 2017).
Þessu leikriti var útvarpað árið 1978 og var þá eingöngu um vísindaskáldskap að ræða en í dag er Google búið að finna upp svipaða tækni sem hefur álíka virkni og fiskurinn nema ekki eins slímuga. Babel-Fish EarbudsTæknin sem um ræðir kallast Pixel Buds. Hún er þróuð af Google og er í formi heyrnartóla. Þessi ágætu heyrnartól notast með Pixel snjallsímanum þeirra og smáforritinu Google Translate. Tæknin virkar þannig að ein manneskja setur heyrnartólin, sem eru eins konar eyrnatappar, í eyrun á meðan önnur manneskja heldur á símanum. Sú sem er með „fiskinn“ í eyranu, styður fingri á hægri eyrnatappann á meðan hún segir eitthvað á sínu móðurmáli. Smáforritið þýðir það sem var sagt yfir á tungumál sem er valið í símanum og spilar það upphátt. Manneskjan sem heldur á símanum svarar því sem var spilað og svarið er síðan þýtt til baka og spilað í gegnum heyrnartólin (Metz, 2017).
Góð hugmynd en slæm hönnun
Google Translate getur þýtt meira en 100 tungumál en Pixel Buds getur enn sem komið er aðeins þýtt 40. Þessi nýja tækni getur brúað tungumálagjá milli tveggja einstaklinga nokkuð fljótt en þó ekki í rauntíma. Samskiptin taka því aðeins lengri tíma en ella, því bíða þarf eftir að tækin þýði það sem er verið að segja í samræðum. Þá ganga þessi samskipti ekki alltaf villulaust fyrir sig eins og þeir þekkja sem hafa notað Google Translate. Tækið á það til að klippa burt endann á setningum á meðan fólk er ennþá að tala og skiptir jafnvel um tungumál í miðjum samræðum.Helstu vankantar á tækinu eru þó hönnunin. Tækið er þungt og fyrirferðarmikið í eyranu á þér. Þó að heyrnartólin eigi að vera þráðlaus og notast við Bluetooth tækni er engu að síður snúra á milli eyrnatappanna sem hægt er að herða til aðlögunar milli eyrna. Þá eiga eyrnatapparnir það til að detta út ef viðkomandi er með lítil eyru. Hægt er að hlaða heyrnatólin en rafhlaðan í þeim endist í 5 tíma (Metz, 2017).
Google Translate
Þar til í september 2016 notaði Google Phrase-Based Machine Translation (PBMT) tækni í þýðingarnar sínar. Sú tækni byggir á Statistical Machine Translation (SMT) en í stuttu máli þá safna eins mikið af upplýsingum í formi texta með orðasamböndum og reyna að finna hliðstæður með tveimur tungumálum. Síðan vinna þeir úr öllum gögnunum og reyna að finna líkurnar á að eitthvað á einu tungumáli þýði eitthvað annað á öðru tungumáli (Zhang, 2017). En Google Translate var ekki alltaf besta leiðin til að þýða heilar málsgreinar af einu tungumáli yfir á annað. Hver kannast ekki við að fá tölvupóst skrifaðan á „íslensku“ af nígerískum prins með Google Translate. Ég fékk einu sinni slíkan póst og hann var svo skemmtilega vitlaust skrifaður að það fékk mig til að brosa. Nú fer þessum vitleysum fækkandi og vinur okkar frá Nígeríu er farinn að geta skrifað nánast eins og innfæddur Íslendingur.
Mynd 1, myndtexti Google Translate.
Google Translate fer óðum fram í að þýða tungumál en frá árinu 2016 hafa þeir verið að notfæra sér framfarir á sviði gervigreindar. Nýja kerfið þeirra GNMT (Google Neural Machine Translation), byggir á ANN eða Artificial Neural Networks (Zhang, 2017). Artificial Neural Networks eru notuð meðal annars í að talgreina og þekkja rithandarsýnishorn. Þessar nýju aðferðir gera þeim kleift að greina setningar sem eina heild frekar en að brjóta þær niður í einstök orð eða frasa. Með hjálp GNMT tekst Google að draga úr villum við þýðingar um meira en 55-85% en vélrænar þýðingar af þessu tagi eru ekki villulausar enn sem komið er, þó að þeim hafi vissulega farið fram (Le og Schuster, 2016).
Mér finnst alltaf gaman að því þegar tæknin eltir vísindaskáldskapinn og Douglas Adams hefði líklega haft gaman af þessum heyrnartólum. Ekki veit ég hvort að hann hafi verið sá fyrsti sem lét sér detta í hug tæki að til að þýða önnur tungumál, jafnóðum og maður heyrði það, en var alla vega sá frumlegasti. Ég er líka viss um að sögupersónunni Arthur Dent hefði líkað betur við að setja heyrnatól í eyrun heldur en að þurfa að troða fisk þangað.
Höfundur: Kolbeinn Páll Erlingsson, nemandi við Háskólann í Reykjavík
Heimildaskrá:
BBC. (2014). Comedy: The Hitchhiker‘s Guide To The Galaxy. Sótt 13. september 2018 af http://www.bbc.co.uk/comedy/hitchhikersguide/index.shtml
BBC Studios. (2017, 21. janúar). Babel Fish - The Oddest Thing In The Universe - The Hitchhiker's Guide To The Galaxy – BBC. [myndskeið]. Sótt 18. september 2018 af https://www.youtube.com/watch?v=iuumnjJWFO4
Metz, R. (2017, 15. nóvember). MIT Technology Review. Sótt 13. september 2018 af https://www.technologyreview.com/s/609470/googles-pixel-buds-translate-a-great-idea-into-horrible-design/#comments
Zhang, M. (2017, 17. ágúst). History and Frontier of the Neural Machine Translation. Sótt 18. september 2018 af https://medium.com/syncedreview/history-and-frontier-of-the-neural-machine-translation-dc981d25422d
Le, Q. V. og Schuster, M. (2016, 27. september). A Neural Network for Machine Translation, at Production Scale. [bloggfærsla]. Google AI Blog. Sótt 13. september 2018 af https://ai.googleblog.com/2016/09/a-neural-network-for-machine.html
Skil á efni
Leita í vefútgáfu Tölvumála
Um Tölvumál
Tölvumál - tímarit Skýrslutæknifélags Íslands er óháð tímarit um tölvutækni og hefur verið gefið út frá árinu 1976.
Vefútgáfa Tölvumála birtir vikulega nýja grein á vef Ský og árlega er gefið út veglegt prentað tímarit undir nafninu "Tölvumál" þar sem fjallað er um tölvutækni frá ýmsum sjónarhornum og er þema blaðsins jafnan valið snemma árs og útgáfa að hausti.
Ritnefnd Ský sér um að afla efni í Tölvumál og geta allir sem áhuga hafa sent inn efni.