En hvað eru tölvuský?
Fyrirtæki keppast nú við að bæta orðinu „Cloud“ (eða tölvuský) í vöruheitin. Stundum er þetta gert til að tilkynna að varan sé nettengd, en stundum þýðir það meir. Í þessari grein verður leitast við að skilgreina og útskýra helstu atriði tölvuskýja. Einfaldast er að hefjast handa með dæmisögu. Apótekið Meðalmenn hf. hefur ákveðið að færa sig inn á netmarkað. Fyrir um áratugi síðan var þetta lítið mál: Vefforritarar voru ráðnir til að skrifa síðuna og settur var upp nýr vélasalur með nokkrum vefþjónum til að hýsa vefinn. Einnig voru kerfisstjórar ráðnir til til að sjá um vélbúnaðinn. Vonin var að vefþjónarnir gætu annað fyrirspurnum, annars þurfti að kaupa meiri vélarbúnað fyrir salinn. En heimurinn breyttist ört síðasta áratuginn og spurningin er hvaða ákvarðanir yrðu teknar ef Meðalmenn væru að fara á markað í dag.
Hefðbundinn rekstur gagnavers
Í fyrsta lagi eru Internetnotendur núna rúmir 2 milljarðar. Þetta þýðir ekki einungis að markaðurinn sé margfalt stærri en áður, heldur verður vefsíðan líka að geta annað skyndilegum vinsældum. Fræg er orðin auglýsing Victoria‘s Secret í Super Bowl árið 1999 þar sem áhorfendur voru hvattir til að horfa á tískusýningu á heimasíðu fyrirtækisins með þeim afleiðingum að síðan hrundi undan gríðarlegu álagi. Í dag getur slík reynsla orðið banabiti fyrir ung fyrirtæki , svo ljóst er að vefsíður þurfa að anna eftirspurn.
Í öðru lagi eru notendur enn kræfari en áður. Þeir eru óþolinmóðir -- Amazon.com mældi t.d. árið 2008 að fyrir hverjar 100ms sem það tæki vefsíðuna að svara notanda tapaðist 1% af sölutekjum. Google mældi að 500ms töf við að birta niðurstöður minnkaði vefumferð um 20%. Fyrirspurn frá notanda í Ástralíu sem send væri á fullum ljóshraða til Íslands og til baka myndi bæta a.m.k. 110ms ofan á vinnslutímann. Ein ástæða þess að stór netfyrirtæki hafa opnað gagnaver út um allan heim er til að vera nær notendunum. Önnur er sú að ef eitthvað bjátar á í einu gagnaveri þá eru til afrit í öðrum. Meðalmenn þurfa t.d. að vera viðbúnir því að Kötlugos geti þurrkað út vélarsalinn. Í dag nægir því ekki lengur að hýsa vefsíðu aðeins á einum stað.
Í þriðja lagi er kostnaðarlíkanið sem við skoðuðum að ofan frekar óhentugt, eins og sjá má á myndinni. Meðalmenn þyrftu til dæmis að fjárfesta mikið í búnaði strax í upphafi rekstursins, einmitt þegar mest er skorið við nögl í fjármálum. Þeir þurftu að spá fyrir um hámarksfjölda notenda og vona að raunverulegur fjöldi þeirra yrði af svipuðum toga. Ef fleiri kæmu en áætlað var annaði vefurinn ekki eftirspurn og notendur yfirgæfu síðuna í pirringi. En ef færri kæmu í heimsókn nýttist vélarbúnaðurinn illa miðað við það sem hann kostaði í innkaupum og rekstri. Best væri því að hámarksgeta gagnavers fylgdi raunverulegri notkun notenda.
Þessi vandamál eru engin einsdæmi, og stórfyrirtæki á borð við Amazon.com þurftu að skoða þau alvarlega. Ef mest bókasala á sér stað að degi til, hvað á þá að gera við þessar tugþúsundir tölva sem malla lítið nýttar yfir nóttina? Hagkvæm nýting skiptir gríðarlegu máli: vélarsalir Google með sínum rúmri milljón tölva draga til dæmis 260MW af afli, eða sem nemur einni og hálfri Búrfellsvirkjun. Hugmynd Amazon.com árið 2006 til þess að bæta nýtingu var: Hvað ef við leigjum tölvurnar út?
Teygjanleiki: Hámarksgeta fylgir raunverulegri notkun
Nokkrum árum áður varð tæknibylting sem gerði þetta kleift. Fyrirtækinu VMware tókst að keyra mörg stýrikerfi samtímis á venjulegri tölvu með svokölluðum sýndarvélum (virtual machines). Sýndarvélar eru aðskildar frá hvorri annarri (sem veitir öryggi) þrátt fyrir að þær deili minni, hörðum diski og örgjörva vélarinnar. Með því að keyra sýndarvélar á tölvunum í gagnaverinu var hægt að skipta verkefnum á tölvunum í smærri einingar og aðlaga fjölda hverrar tegundar eftir notkun og þörfum.
Árið 2006 hóf Amazon.com að leigja út sýndarvélar undir nafninu Elastic Compute Cloud (EC2) – fyrsta tölvuskýið. Notendur tiltaka hversu margar sýndarvélar þeir þurfa og hvaða stýrikerfi eigi að keyra á þeim, og fá í staðinn IP tölur þar sem unnt er að tengjast sýndarvélunum í gegnum Secure Shell. Ef búist er við mörgum fyrirspurnum má fjölga sýndarvélum, eða fækka þeim sé þess þörf. Leigan er nokkrar krónur fyrir hvern klukkutíma sem örgjörvakjarni er notaður, og svipuð verðskrá fyrir minnisnotkun, geymslurými og nettraffík. Helsti kosturinn við EC2 er því kostnaðarlíkanið: Þú borgar fyrir það sem þú notar. Þetta er ekki ósvipað því hvernig við borgum fyrir aðgang að raf- og vatnsdreifikerfum.
Víkjum sögunni aftur að Meðalmönnum og þeirra stöðu. Það vill svo til að EC2 myndi greiða úr öllum þeim erfiðleikum sem fyrirtækið stendur frammi fyrir. Gagnaver Amazon eru víða um heim sem fyrirbyggir gagnamissi og kemur í veg fyrir að notendur upplifi biðtíma við fyrirspurnum sökum fjarlægðar til gagnavers. Það er bæði auðvelt og hraðvirkt að bæta við sýndarvélum ef eftirspurn eftir síðunni vex skyndilega. Ennfremur þar sem þeir borga aðeins fyrir það sem þeir nota er hægt að láta hámarksgetu síðunnar (fjölda sýndarvéla) fylgja raunverulegri eftirspurn. Þessi eiginleiki er kallaður teygjanleiki (elasticity) tölvuskýsins. Þess má geta að hefðu Meðalmenn notað EC2 frá upphafi hefði þeir aldrei þurft að kaupa tækjasal og vefþjóna – hjá EC2 borga síður í raun aðeins eftir eigin vinsældum.
Þessi lýsing á EC2 snertir á mörgum helstu eiginleikum tölvuskýja. Hugmyndin er að geta haft samskipti við einhverja síðu („skýið“) með einhverju viðmóti en þurfa ekki að hafa áhyggjur af því á hvaða tölvubúnaði eða netbúnaði hlutirnir eru unnir eða geymdir. Skýjaheitið er dregið af hinum kunnuglegu gömlu teikningum sem sýna nettengingar milli símkerfa, netbeina og jaðartækja, en þar er Internetið yfirleitt teiknað sem skýjahnoðri. Skilgreining Evrópusambandsins hljómar á þessa leið: Tölvuský er teygjanlegt, áreiðanlegt keyrsluumhverfi með þjónustu á samnýttum auðlindum og mælingu notkunar. Með auðlindum er átt við notkun örgjörva, vinnsluminnis, o.s.frv. Mörg tölvuský nota sýndarumhverfi (virtualization) og bjóða upp á dreifða hýsingu. Til að flækja málin eru til þrjár megintegundir tölvuskýja.
Tegundir tölvuskýja
Amazon EC2 og Rackspace.com veita þjónustu á innviðum gagnaveranna, svonefnt Infrastructure-as-a-Service (IaaS). Allt sem viðkemur netbúnaði, gagnageymslu, tölvubúnaði og sýndarvélum er í höndum rekstaraðilans, en leigjandinn sér sjálfur um stýrikerfi, keyrsluumhverfi, gögn og forrit sem keyra inni í skýinu. Með Platform-as-a-Service (PaaS), eins og til dæmis Google Apps og Microsoft Azure, sér rekstraraðilinn einnig um stýrikerfin, keyrsluumhverfið og viðmótið við skýið er því í gegnum forritunarköll. Sá skilningur sem margir leggja aftur á móti í hugtakið tölvuský er Software-as-a-Service (SaaS) þar sem rekstraraðilinn sér um alla forritun og hýsingu. Gmail, vefpóstur Google, og viðskiptatengslafyrirtækið Salesforce.com eru dæmi um þessa tegund tölvuskýja.
Tölvuský tvinna saman margar spennandi hugmyndir og eru frjór jarðvegur fyrir rannsóknir og þróun. En væntingar til nýjunga eru iðulega of miklar fyrstu árin og tölvuský eru þar á tindinum. Þeir lesendur sem ekki þekkja „Gartner‘s Hype Cycle“ um félagsfræðileg viðbrögð við tækninýjungum sem er dregin upp hér til hliðar eru eindregið hvattir til að kynna sér við hverju er að búast. Þrátt fyrir háar væntingar og lof um tölvuský er margt sem enn þarf að huga betur að.
Viðskiptalega séð eru þrír megingallar á gjöfum Njarðar. Samkvæmni (compatibility) milli tölvuskýja eru nánast engin og því auðvelt að verða innlyksa hjá ákveðnum leiguaðila. Þau veita einnig takmarkaða persónuvernd og hafa fremur gloppótt öryggi, svo stór fyrirtæki og stofnanir með viðkvæm gögn ættu ef til vill frekar að hýsa og reka einkaský (private cloud) til að fyrirbyggja misnotkun. Þetta kann að breytast í framtíðinni vegna nýlegra uppgötvana í sammóta dulkóðun (homomorphic encryption) því slík tækni myndi gera rekstraraðilum skýsins kleift að vinna með dulkóðuð gögn án þess að þurfa að afdulkóða gögnin sjálf eða læra nokkuð um þau. Slík tækni á þó langa leið á markað. Ennfremur er kolefnislosun af völdum gagnavera tölvuskýja æði stórtæk, enda orkugjafarnir fyrir rafmagnið sem knýr gagnaverin oftast kol eða gas. Þarna er tækifæri fyrir Íslendinga: að hýsa gagnaver fyrir tölvuský sem notar einungis endurnýjanlega orku. Sprotafyrirtækið Greenqloud stefnir til að mynda inn á þennan markað.
Tölvuskýin eru líka ný af nálinni og luma því á mörgum tæknilegum vanköntum sem verið er að rannsaka. Það er auðvelt að bæta við sýndarvélum þegar álag er mikið (skala út), en lítið er vitað um hvernig hægt sé að stækka sýndarvélina sjálfa og teygja notkunina lóðrétt (skala upp) ef þörf er á. Þjónustur innan tölvuskýja glíma einnig við það vandamál að vera með marga leigjendur (multi-tenancy). Útreikningar og gögn sem tengjast sama fyrirtæki eða nátengdum fyrirtækjum er stundum haldið of aðskildum (t.d. hvað varðar sýndarvélar) og vatnið því iðulega sótt yfir lækinn. Á hinn bóginn aðskilja sumar skýjaþjónustur ekki viðskiptavinina nógu vel (t.d. notkun biðminnis fyrir gagnagrunna) sem veldur því að þjónustugæðin geta verið dræm og óútreiknanleg hjá sumum notendum. Annað stórt vandamál er að tryggja samkvæmni gagna þegar átt er við risastór dreifð kerfi, þar sem samkvæmni merkir að allir málsaðilar sem nota kerfið sjá atburði gerast í sömu röð. Sem dæmi um samkvæmni er mikilvægt að fyrirspurn þín um að amma megi ekki skoða Facebook-myndaalbúmin sé keyrð í kerfinu áður en þú skellir upp myndum af svaðilförum verslunarmannahelginnar. Í stórum dreifðum kerfum á borð við Facebook og tölvuský er fræðilega ekki hægt að tryggja samkvæmni ef ennfremur er krafist að síðan svari öllum fyrirspurnum og virki þrátt fyrir pakkatap á netinu (svonefnd CAP-setning Eric Brewers), allt eðlilegar kröfur. Þessi niðurstaða hefur hrint af stað miklum rannsóknum um hvers konar gagnasöfn sé best að nota í tölvuskýjum, en enn er langt í land með skýr svör.
Engu að síður er ljóst að Meðalmenn hf. og álíka fyrirtæki myndu bera hag að því að kynna sér kosti og galla þess að skýjavæða hugbúnað og vefhýsingu því það getur verið hagkvæmara og öruggara en aðrir kostir í stöðunni. Kerfisstjórar og vefforritarar ættu ennfremur að kynna sér tölvuský til að missa ekki af lestinni. Þótt heiti þeirra séu illa skilgreind, misnotuð og gufukennd, eru þau vissulega komin til að vera.
Höfundur: Dr. Ýmir Vigfússon, lektor í tölvunarfræði við Háskólann í Reykjavík. (ymir@ru.is).
Greinin er byggð á samnefndum fyrirlestri sem haldinn var á Haustráðstefnu Skýrr, 9. september 2011.
Skil á efni
Leita í vefútgáfu Tölvumála
Um Tölvumál
Tölvumál - tímarit Skýrslutæknifélags Íslands er óháð tímarit um tölvutækni og hefur verið gefið út frá árinu 1976.
Vefútgáfa Tölvumála birtir vikulega nýja grein á vef Ský og árlega er gefið út veglegt prentað tímarit undir nafninu "Tölvumál" þar sem fjallað er um tölvutækni frá ýmsum sjónarhornum og er þema blaðsins jafnan valið snemma árs og útgáfa að hausti.
Ritnefnd Ský sér um að afla efni í Tölvumál og geta allir sem áhuga hafa sent inn efni.