Töökindlus
KA PILVE TEENUSED KUKUVAD MAHA JA SEE ON TäIESTI OKEI

On suhteliselt levinud arusaam, et pilveteenused on justkui veakindlad ja nendes teenustes kunagi rikkeid ei teki. Küll aga näeme päriselus ikka ja jälle teavitusi riketest pilveteenustes. Just värskelt oli rike AWS ühes USA regioonis, mis mõjutas nii väikseid kui suuri üle maailma – alates Amazoni enda teenustest kuni kohtinguäppide, turvasüsteemide ja robotiteni, kes kõik oma tööks pilveteenuseid vajavad. Kui enne seda toimus suurem katkestus Fastly teenuses, mis halvas taas suure osa internetist, siis samasuguseid maasolekuid on näinud pea kõik suured ja väikesed pilveteenuste pakkujad.
Kas see tähendab, et pilveteenused ei ole usaldusväärsed?

Tehnika on tehnika – sõltumata sellest, kas see asub pilves või kuskil mujal – ja tuleb arvestada, et rikete tekked on paratamatud ja ainult aja küsimus. Õnneks oskavad pilveteenuste arendajad ja arhitektid sellise paratamatusega igal sammul arvestada ja loovad kriitilistele teenustele ja andmetele vajalikud tagavarasüsteemid, kuhu nii taristu kui seal olev tarkvara oskab rikke puhul automaatselt ümber lülituda.

Pilveteenuse katkestus on kriitilise tähtsusega kõikide klientide jaoks, kelle äri sellest sõltub – olgu see haigla, mõni riiklik teenus või e-pood. Näiteks kui e-pood on majutatud AWSi Virginia andmekeskuses USAs, kus oli alles hiljuti katkestus, siis selleks, et katkestus ei oleks e-poe tööd häirinud, oleks pidanud olema sellest koopia ka mõnes Euroopa andmekeskuses. Siis oleks õigesti loodud süsteem külastajad automaatselt suunanud Ameerikast Euroopas asuvasse e-poodi. Kliendid poleks taustal toimunud teenusrikkest isegi aru saanud ja e-poe omanikul poleks ükski müük tegemata jäänud.

Kõlab lihtsalt ja loogiliselt, kuid paraku ei osata sellise võimalusega piisavalt sageli arvestata ja teadlikult ei looda süsteeme kohe alguses töökindlaks. 

Selle taga on reeglina kaks põhjust. Esiteks vale arusaam, et pilv on justkui igast asendist ning ilma oskusteta kasutades täielikult veakindel. Samas rõhutavad nii pilveteenuse pakkujad kui tõestavad ka päriselu näited, et see ei vasta tõele.

Teine levinud põhjus on loogilise ja kalkuleeritud riski võtmine: ettevõtted kalkuleerivad täpselt, kui palju maksab neile mingi teenuse maasolek näiteks ühes tunnis ja kui palju maksab selle teenuse töökindlaks tegemine. Selle arvutuse pealt otsustatakse, kas ettevõtte omanikule on kasulikum, kui teenus ei ole mingi arv tunde kättesaadav või kui see muudetakse töökindlamaks.

Arusaadavalt võib teenuse töökindlamaks tegemine olla kulukas ettevõtmine, kuid õnneks on selleks erinevaid viise. Näiteks saab töökindlust tõsta ainult kriitilisemate teenuste ning andmete dubleerimisega samas geograafilises regioonis asuvate andmekeskuste vahel või dubleerida teenuse kriitilisemad osad erinevates geograafilistes regioonides asuvate andmekeskuste vahel.

Veelgi töökindlamat lahendust luues on võimalik dubleerida teenused peale erinevate geograafiliste regioonide ka erinevate pilveteenuse pakkujate vahel.

Kokkuvõttes tuleb alati meeles pidada, et iga tehnoloogia läheb aeg-ajalt rikki. Sellega arvestades on võimalik säästa nii närve kui raha – olles reaalsetest riskidest teadlik, saab varakult ette valmistada nii arendustöid, tööprotsesse kui ka kriisikommunikatsiooni.

Klemens Arro
CEO of ADM Cloudtech

See artikkel on avaldatud ka Geenius DigiPro portaalis.