Objektines duomenų saugyklas (ODS) pirmiausia pradėjo naudoti debesų kompiuterijos tiekėjai (Amazon S3, Google Cloud Storage, Microsoft Azure), vėliau ši technologija buvo pritaikyta tokiose populiariose paslaugose kaip DropBox, BackBlaze, Facebook, Rackspace ir kitose. Rinkoje šiuo metu yra atviro ir komercinių produktų, o tokio tipo sprendimai plačiai naudojami tiek paslaugų tiekėjų, tiek įmonių IT ūkyje.
Kalbant apie ODS pirmiausia pabrėžiama, kad tokio tipo saugyklos labiausiai tinka saugoti „nestruktūruotai informacijai“. Liaudiškai tariant tai viskas, „kas guli ant Desktop’o ir F:“, o tiksliau – elektroniniai dokumentai, failai, fotografijos, skenuota medžiaga, duomenų archyvai ir panašiai. Kitaip, negu pvz., duomenų bazėse saugoma informacija, nestruktūruota informacija neturi griežtai apibrėžtos struktūros (koks siurprizas !!!). Nepaisant to, kad „nestruktūruota informacija“ skamba kažkaip nerimtai, ji dažnai sudaro apie 70-90% visos įmonėje saugomos informacijos.
Kodėl tokio tipo duomenų saugyklos yra patrauklios įmonėms ir paslaugų tiekėjams?
Pirmiausiai, ODS priežiūra ir plėtimas yra gerokai paprastesnis negu kito tipo duomenų saugyklų. Norint padidinti ODS talpą pakanka sukonfigūruoti naują mazgą ir prijungti jį prie tinklo. Kadangi objektai saugykloje saugomi „plokščioje struktūroje“, po prijungimo nereikia išplėsti failų sistemos arba primontuoti diskų tam, kad papildoma talpa taptų pasiekiama programoms. Imate ir naudojate!
Antra, ODS naudoja architektūrą, kuri padeda labai patikimai saugoti duomenis. Yra akivaizdu, kad informacijos kiekiui pasiekus šimtus terabaitų, sukurti atsargines kopijas, o paskui jas atstatyti, gali būti labai sudėtinga. Todėl saugyklos sprendimas turi pasiekti tokį patikimumą, kad atsarginės duomenų kopijos arba archyvavimas taptų nebereikalingas. Paskirstyta ODS architektūra leidžia pasiekti labai aukštą patikimumą, o naudojant geografiškai paskirstytas sistemas galima išspręsti ir avarinio atstatymo klausimus. Dažniausiai ODS saugo duomenis bent trijose mazguose, kurie gali būti skirtinguose duomenų centruose arba net šalyse.
Trečia, duomenų saugyklos mazgams nereikia specializuotos „geležies“. Tam dažniausiai naudojami serveriai „nuo lentynos“, o visos duomenų valdymo, paskirstymo ir patikimumo funkcijos yra įgyvendintos programose, aptarnaujančios ODS telkinį (angl. cluster), kode. Nors kiekvienas atskiras serveris nėra labai patikimas, tačiau bendrame telkinyje serverio arba net serverių grupės gedimas nedaro įtakos paslaugos patikimumui. Sugedusius standartinius serverius lengva pakeisti kitais, panašaus tipo serveriais.
Ketvirta, ODS turi gerai išvystytas programavimo bibliotekas, kurios padeda integruoti duomenų saugyklą į įmonėje naudojamas programas. Vienas iš mūsų klientų, iš pradžių svarstęs apie galimybę saugoti elektronines sąskaitas failų serveryje, testavo ODS biblioteką ir pirmus bandomuosius dokumentus galėjo sukelti jau po kelių valandų. Visi integravimo ir testavimo darbai užtruko apie mėnesį. Kadangi kiekvienam ODS saugomam objektui automatiškai priskiriamas nuoroda, kurią galima „atidaryti“ su įprasta interneto naršykle, šis projektas gerokai supaprastino elektroninių sąskaitų pateikimą klientams bei išsprendė problemas, susijusias su informacijos pasidalinimu įmonės viduje.
ODS žinoma nėra „sidabrinė kulka“ ir negali būti naudojama tada, kai:
- Saugomi duomenys labai dažnai keičiami (angl. transactional data);
- Reikia labai aukšto skaitymo ir rašymo operacijų greičio (pvz., duomenų bazių saugojimas);
- Įrašymo operacijų yra gerokai daugiau, negu skaitymo.
Tačiau duomenų archyvams, video ir audio medžiagos, failų saugojimui tai yra labai patrauklus sprendimas. Antroje straipsnio dalyje papasakosiu apie praktinius ODS diegimo aspektus, o žemiau įdedu nuorodą į video, kuriame matosi mūsų inžinierių kūrinys: švieslentė, kuri realiu laiku rodo informaciją apie OpenStack SWIFT saugomos informacijos kiekį!
AUTORIUS
Kęstutis Liaugminas – UAB „Blue Bridge“ Produktų plėtros skyriaus vadovas