IT specialistams

Veiklos tęstinumo planas: kaip pasirengti blogiausiam IT nelaimės scenarijui?

Podcast’ai Spotify platformoje

Nuo techninių nesklandumų ar plataus masto kibernetinių atakų, galinčių paralyžiuoti svarbiausių sistemų ir IT infrastruktūros darbą, nėra apsaugotas nei vienas duomenų centras ar serverinė. „Apsaugoti svarbių duomenų nuo visų pavojų net teoriškai neįmanoma, todėl reikia atlikti pasiruošimo darbus ir parengti Veiklos tęstinumo planą. Toks planas užtikrina, kad susidūrus su IT veiklos iššūkiais, kritinių sistemų darbą būtų galima atkurti kaip įmanoma greičiau“, – sako „Blue Bridge“ IT valdymo ir priežiūros paslaugų specialistas Rokas Ališauskas, pasidalydamas rekomendacijoms, kurias „Blue Bridge“ specialistai teikia savo klientams, siekdami apsaugoti juos nuo kritinių sistemų veiklos sutrikimų.

Atsparumą IT nelaimėms galima įvertinti

Kaip pastebi pašnekovas, IT nelaimių „asortimentas“ labai platus – pradedant netyčiniu svarbiausių duomenų ištrynimu, programinės įrangos gedimais, fizinės įrangos perkaitimu ir baigiant kibernetine ataka, kurios metu duomenys užšifruojami.

„Tačiau yra veiksnių, didinančių riziką prarasti duomenis. Pavyzdžiui, tikimybė patirti IT nelaimę didesnė, jeigu fizinė įranga duomenų centre ar serverinėje – nedubliuota arba visi duomenys laikomi vienoje lokacijoje. Taip pat – jei fizinė įranga laikoma tam nepritaikytose patalpose. Galiausiai, nemažą grėsmę kelia pasenusi, gamintojo nebepalaikoma IT infrastruktūros programinė įranga“, – vardija R. Ališauskas.

Nepriklausomai nuo IT nelaimės tipo, bendras visų IT nelaimių vardiklis – prarasti duomenys. Tačiau, kaip pabrėžia pašnekovas, pasirūpinti vien duomenų kopijomis neužtenka, juolab, kad ir šis procesas yra daug sudėtingesnis, nei gali pasirodyti.

„Tinkamu pasirengimu galima vadinti tik vientiso Veiklos tęstinumo plano parengimą. Šį planą turėtų papildyti ir detalus IT veiklos atkūrimo (angl. disaster recovery, DR) procedūros planas, kuriame reikėtų nurodyti, kas konkrečiai už ką atsakingas ir inicijuoja Veiklos tęstinumo planą ištikus IT nelaimei“, – sako „Blue Bridge“ IT valdymo ir priežiūros paslaugų specialistas.

Pirmasis žingsnis – kritinės reikšmės sistemų ir duomenų nustatymas

Rokas Ališauskas

Veiklos tęstinumo planą paprasčiausia apibrėžti kaip dokumentą, kuriame konkrečiai nurodyta, ką reikėtų daryti, nutikus IT nelaimei: kaip ir kur planuojama pratęsti veiklą, per kiek laiko atstatyti IT sistemų veikimą, kokiais būdais tai padaryti ir t. t. Šis dokumentas gali būti įvairaus detalumo, tačiau jame turėtų būti aptarti keli kertiniai veiklos tęstinumo aspektai.
R. Ališauskas pataria, kad pradėti reikėtų nuo kritinių sistemų arba duomenų indentifikavimo. Kitaip tariant – apibrėžti, ką konkrečiai saugote nuo IT nelaimių.

„Pavyzdžiui, galima iš pradžių įvertinti, kiek patirsite nuotolių, jeigu nustotų veikti kiekviena jūsų naudojama sistema. Tai gali būti atspirties taškas tolimesnei analizei, vertinant, kiek ilgai gali būti atstatinėjamas kiekvienos iš sistemų darbas be didesnės įtakos svarbiausiai veiklai; kokios investicijos į duomenų kopijavimo ir atstatymo sprendimus yra optimalios turint omeny konkrečių duomenų svarbą ir t. t. Svarbiausia nepamiršti, kad ne visi duomenys – vienodai svarbūs ir Veiklos tęstinumo plane išskirti prioritetines sistemas ar duomenis“, – pasakoja R. Ališauskas.

Duomenų atstatymo greitis ir kiekis – svarbiausi rodikliai

Kita kertinė veiklos tęstinumo plano dalis susijusi su laiku, per kurį atsarginės duomenų kopijos leis atnaujinti pilnavertį sistemų darbą. Čia svarbiausios dvi bazinės sąvokos – duomenų atstatymo laikas (angl. Recovery Time Objective (RTO)) ir prarastų duomenų kiekis (angl. Recovery Point Objective (RPO)).

„RTO ir RPO laikai tiesiogiai susiję su Veiklos tęstinumo plano biudžetu ir tuo, kokį duomenų kopijavimo būdą optimaliausia pasirinkti. Esminis principas paprastas – kuo trumpesnis duomenų atstatymo laikas, tuo didesnė duomenų atstatymo kaina“, – pasakoja R. Ališauskas ir dar kartą pabrėžia, kad todėl svarbu nusistatyti, kurias sistemas ar duomenis reikia „išgelbėti“ pirmiausia: „Tikrai ne visos sistemos turi būti atstatytos per porą valandų. Kai kurių, veiklai ne kritinių sistemų ar duomenų atstatymas gali vykti ir savaitę.“

Duomenų kopija ir duomenų replika nėra tas pats

Veiklos tęstinumo plane rekomenduojama numatyti ir kitus su atsarginėmis duomenų kopijomis susijusius dalykus. Pavyzdžiui, vertinat kiekvieną sistemą, nuspręsti, ar bus daromos jos duomenų kopijos ar duomenų replikos, kokiu dažnumu bus kopijuojami duomenys ir t. t.

„Reikėtų pažymėti, kad duomenų replika nėra tas pats, kas atsarginė kopija. Duomenų replika padeda greičiau atkurti veiklą, tačiau neapsaugo nuo duomenų sugadinimo – tai užtikrina duomenų kopija. Dėl šios priežasties „Blue Bridge“ klientams rekomenduojame kurti ir duomenų kopijas, ir replikas“, – pastebi pašnekovas.

Svarbiausias visų detalių, susijusių su duomenų kopijavimu, numatymo tikslas – pasiekti, kad duomenys būtų išsaugoti ne fragmentiškai, o tokiu pavidalu, kuris leistų juos kaip įmanoma greičiau atkurti ir tęsti sistemų darbą.

„Todėl plane pravartu iškart konkrečiai nurodyti ir tai, kur fiziškai saugomos atsarginės kopijos, kas už jas atsakingas, kokia programinė įranga ir kopijavimo būdai naudojami ir kitą informaciją, kuri gali būti svarbi operatyviai atkuriant sistemų darbą“, – vardija R. Ališauskas.

Testavimas – ne tik aprašytas, bet ir nuolat atliekamas

Blue Bridge disaster recovery

Vis tik, ko gero, svarbiausia Veiklos tęstinumo plano dalis yra atsarginių duomenų atstatymo testai. Jų metu tikrinama, ar nukopijuoti reikiami duomenys ir ar sistemų darbas gali būti atstatytas kaip planuota per numatytą laiką. Taip pat įsitikinama duomenų kopijavimo bei atstatymo kokybe. Remiantis šiomis įžvalgomis gali būti koreguojamas ir Veiklos tęstinumo planas.

„Testų reguliarumas nereiškia, kad kiekvieną mėnesį reikia atkūrinėti visų sistemų darbą. Priklausomai nuo sistemos ir duomenų kritiškumo rekomenduojame bent kartą per mėnesį atlikti vis kito virtualaus serverio ar rezervinės duomenų kopijos atstatymo patikrinimą“, – sako R. Ališauskas.

Veiklos tęstinumo plane turėtų būti numatyta ir tai, kokioje IT infrastruktūroje ir duomenų centre rezervinės kopijos bus atstatinėjamos, jei pagrindinė lokacija ir svarbiausia fizinė įranga bus sugadinta.

„Dar vienas rekomenduojamas punktas – bent jau preliminarus planas, kaip bus grįžtama į pagrindinę IT infrastruktūrą ar duomenų centrą po IT nelaimės, kai svarbiausios problemos bus pašalintos ir normali IT infrastruktūros būsena atstatyta“, – pataria „Blue Bridge“ IT valdymo ir priežiūros paslaugų specialistas.

Gerosios praktikos, padedančios rengti Veiklos tęstinumo planą

Ir vertinant savo parengtą Veiklos tęstinumo planą, ir tik pradėjus jį kurti, pravartu susipažinti su populiariausiomis gerosiomis praktikomis.

„Pavyzdžiui, paspirtimi dėliojant Veiklos tęstinumo plano priemones galėtų būti „3-2-1“ taisyklė. Pagal ją rekomenduojama turėti tris skirtingas duomenų kopijas, dvi skirtingas duomenų kopijų laikmenas (pavyzdžiui, „debesis“ ir magnetines juostas) ir nutolusią lokaciją, kurioje saugomos kopijos, t. y. rezervinės duomenų kopijos turi būti saugomos ne pagrindiniame duomenų centre ar serverinėje“, – paaiškina R. Ališauskas.

Tuo atveju, jeigu rezerviniu duomenų kopijavimu rūpinasi IT tiekėjas, atspirties tašku planuojant veiklos tęstinumą gali tapti tiekėjo siūlomi duomenų kopijavimo ir atstatymo paslaugų SLA – paslaugų lygio susitarimas (angl. Service Level Agreement).

„Standartinės paslaugos gali apimti, pavyzdžiui, 14 dienų atsarginių kopijų saugojimo paslaugą „debesyje“, periodinį tam tikrų sistemų atkūrimo testavimą ir konkretų laiką, pavyzdžiui, vieną valandą, per kurią tiekėjas įsipareigoja atkurti konkrečios sistemos darbą. Visi šie rodikliai leidžia geriau įvertinti savo pasirengimą IT nelaimei, sudėlioti konkretų Veiklos tęstinumo planą ir gali būti koreguojami atsižvelgiant į sistemų ar duomenų kritiškumą, testų rezultatus, turimą biudžetą ir t. t.“, – pastebi pašnekovas.

Svarbiausi Veiklos tęstinumo plano punktai:

  • Kritinių sistemų/duomenų indentifikavimas.
  • Numatyti RTO ir RPO laikai.
  • Visa informacija, susijusi su duomenų kopijomis/replikomis.
  • Testavimo kalendorius, kurio laikomasi.

 „Blue Bridge“ rezervinis kopijavimas ir avarinis IT atstatymas – susisiekite ir sužinokite daugiau!

Disaster Recovery

Įvertink šį straipsnį

    Prenumeruokite ir gaukite žinias pirmieji

    Taip pat skaitykite

    Skaityti daugiau
    Skaityti daugiau