Missä tietoni oikeastaan sijaitsevat? Osa 2: SDS ja hyperkonvergoidut tallennusjärjestelmät

maanantai 24. huhtikuuta 2017 - Kirsi Paasivirta

Jo usean vuoden ajan IT-osastot ja -päälliköt ovat pyrkineet keskittämään laitteistoja ja kustannuksia palvelinkeskuksiin. Yhä useammat palvelinkeskuksissa sijaitsevat palvelimet taas ovat nykypäivänä virtuaalisia, mikä on vähentänyt fyysisten laitteiden määrää ja energian kulutusta, sekä pienentänyt ylläpito- ja laitteistokustannuksia.

Näitä lukemattomia virtuaalikoneita ja -palvelimia hallinnoi ”Software-defined Storage” eli SDS, joka luo useita ohjelmistokerroksia hallinnoidakseen ja yhdistelläkseen palvelinkeskuksen toimintoja, kuten tiedonsiirtoa, palvelimia, tallennustilaa, verkkoyhteyksiä tai tietoturvaa. Tämän tyyppiset tallennusratkaisut ovat ohjelmistopohjaisia, niitä voidaan – teoriassa – käyttää useilla erilaisilla laitteilla. Käytännössä on kuitenkin järkevää, että SDS:a käytetään ainoastaan laitteilla, jotka on jo testattu ja hyväksytty ohjelmiston toimittajalla.

Uusin keksintö yritysten IT-infran selkeyttämiseen ja tehostamiseen on hyperkonvergoidut tallennusjärjestelmät, joilla haetaan myös kustannussäästöjä. Tyypillistä hyperkonvergoiduille tallennusratkaisuille on, että ne käyttävät useita toisiinsa yhdistettyjä teknologioita, mutta järjestelmää hallitaan kuitenkin yhtenä järjestelmänä. Hyperkonvergoiduissa tallennusjärjestelmissä yhdistyy oikeastaan kaikki aikaisemmin käytetyt tallennusmenetelmät, kuten konvergoitu tallennus, perinteinen tallennus sekä laitteen ohjelmistopohjaisesti määriteltävä tallennus yhdeksi ”serverimuotoiseksi” tallennusratkaisuksi. Tämä viimeisin tallennusratkaisu on palvelinpohjainen ja linkittyy teknisesti yhteen eri tallennusratkaisujen kanssa. Kuten SDS, myös hyperkonvergoitu tallennus perustuu virtualisointiin ja ohjelmistopohjaiseen hallinnointiin, mutta se on lisäksi liitetty laitteistoon.

Hyperkonvergoitujen järjestelmien voidaan siis sanoa olevan laitteiston muodossa olevia infrajärjestelmiä, jotka on suunniteltu hyvin ohjelmistokeskeisesti, mutta niihin on integroitu prosessori, tallennustila, verkko, virtualisointi sekä muita teknisiä osia.

Teknisestä näkökulmasta ajatellen hyperkonvergoidun tallennusratkaisun käyttäjät hyötyvät valtavasti siitä, että koko infrastruktuuri ja virtuaalikoneet on keskitetty yhteen paikkaan. Palvelinkeskusten resurssit ovat tuotu yhteen, josta johtuen samaa resurssia pystytään käyttämään tehokkaasti myös jaettuna. Yritysten on suhteellisen helppo hallinnoida monimutkaistakin infrastruktuuria, kun virtualisointi, tallennus, tietojenkäsittely, verkkopalvelut, tietojen hallinnointi ja tietosuoja ovat yhden palvelun takana.

Yritysten ei myöskään tarvitse sijoittaa kalliisiin laitteistoihin, koska tämän tyyppiset järjestelmät toimivat yleisesti tunnetun ja suhteellisen edullisen x86 laitteiston avulla. Toisin kuin integroidut järjestelmät, laitteistoja voidaan päivittää paremmiksi ja virhetilanteen sattuessa jakaa pienemmiksi yksiköiksi. Tiivistettynä: Hyperkonvergoidut ratkaisut eivät tarvitse yhtä paljon tallennus-, tai laajakaistatilaa kuin integroidut järjestelmät, sekä säästävät laitteistojen hankintakuluissa ja sähkönkulutuksessa. Erilaisia resursseja on myös huomattavan helppo lisätä tai poistaa.

Mihin tiedot oikeastaan tallennetaan laitteiston ohjelmistopohjaisesti määriteltävissä tallennusratkaisussa tai hyperkonvergoidussa tallennusratkaisussa?

Kysymykseen on hankala vastata, sillä tiedon tallennuspaikka riippuu paljolti käytetystä tallennusratkaisusta. Yleisesti ottaen, SDS- tai hyperkonvergoidut ratkaisut sisältävät useita datakerroksia. Yksinkertaistettuna järjestelmän rakennetta voidaan verrata venäläiseen maatuskaan: Käyttäjätieto sijaitsee sisimmässä kerroksessa, kun taas käytettävä teknologia lisätään tämän päälle. Yllä olevassa kuvassa on kuvailtu laitteiston ohjelmistopohjaisesti määriteltävä tallennusratkaisu. Päällimmäinen tietokerros on SDS-ohjaimen luoma ja se sisältää tietoa virtuaalijärjestelmästä, seuraava kerros on hypervisorin luoma varsinainen virtualisointi. Tämän kerroksen alla on palvelinkerros, jota seuraa kerros, joka sisältää fyysiset tallennuslaitteet. Kaiken kaikkiaan rakennelma koostuu neljästä kerroksesta.

Toisin kuin SDS-ratkaisussa, hyperkonvergoidussa versiossa hypervisorin luoma kerros on kerrostuman päällimmäinen ja viimeisin kerros. Tämän kerroksen alapuolelle on lisätty tietoa SDS- ohjaimesta ja lopulta säilytettävä tieto on alimmaisena kaikkien muiden kerrosten keskellä. Jos tämä ei vielä ole tarpeeksi monimutkaista, jatkakaapa lukemista:

Yksi SDS- ja hyperkonvergoidulle ratkaisuille tyypillinen piirre on että, useat niistä käyttävät omia tiedostojärjestelmiä. NetApp tallennusratkaisut esimerkiksi käyttävät omaa WAFL – ”Write Anywhere File Layout – järjestelmää, joka kehitettiin yrityksen omaa Data Ontap järjestelmää varten. NetApp tarjoaa myös kaksi muuta käyttöjärjestelmää, joissa on kummassakin omat etunsa. VMware:n VSAN käyttää omaa tiedostojärjestelmää nimeltään “on-disk Filesystem” (VSAN FS). Dell EMC tarjoaa VMware VSAN:nia sen omille PowerEdge palvelintuotteille. Dell:in Big Datan tallennusratkaisu EMC – Isilon- taasen käyttää toista tiedostojärjestelmää nimeltään Isilon OneFS (”1 filesystem”).

Yksinkertaistettuna: Melkein kaikki SDS- tai hyperkonvergoidut tallennusratkaisut käyttävät omia tiedosto- ja/tai käyttöjärjestelmiä. Tietojen hävitessä ja niitä palautettaessa, tarvitseekin ensin todella tutustua järjestelmän saloihin pystyäkseen palauttamaan menetetyt tiedostot.

Onko tietojen palautus mahdollista SDS- tai hyperkonvergoiduissa tallennusratkaisuissa?

Useissa tapauksissa Kroll Ontrackin asiantuntijat ovat onnistuneesti palauttaneet monimutkaisten, useita tiedostokerroksia sisältävien tallennusjärjestelmien tiedostot. Yhdessä tunnetuista tapauksista oli kyseessä melkein uusi VMware vSAN-järjestelmä, joka romahti täysin yhden välimuistina käytettävän SSD-levyn takia. Tallennustilan hallinnointiin ja organisointiin käytettävää vSAN vSphere EXSi oli ollut käytössä vasta muutaman kuukauden, kun se sakkasi. Näin monimutkaisen järjestelmän ollessa kyseessä, tietojen hävitessä tai laitteiden rikkoutuessa, on tietojen palautukseen erikoistuneiden asiantuntijoiden käsiteltävä monta eri kerrosta. Järjestelmä koostui 15 kiintolevystä ja kolmesta SSD-levystä. Yhden SSD-muistin vaurioituessa korttitalo ns. romahti ja neljä suurta virtuaalikonetta lakkasi toimimasta.

Palauttaakseen ja tallentaakseen kaikki hävinneet tiedostot järjestelmästä, Kroll Ontrackin asiantuntijat kehittivät uusia ohjelmistotyökaluja löytääkseen tarvittavan lokitiedoston ja identifioidakseen ja kootakseen hävinneet tiedostot. Asiantuntijamme pystyivät palauttamaan virtuaalikoneet sekä kaikki tiedostot, jotka olivat tallennettu vSAN-järjestelmään.

Tämä esimerkki havainnollistaa, että eri teknologioita ja tiedostokerroksia sisältävien SDS- tai hyperkonvergoitujen tallennusratkaisujen tietojen palauttaminen on mahdollista. Se kuinka monta kerrosta tietoa on palautettavana, riippuu pitkälti käytetyistä tuotteista ja teknologiasta. Jokaisessa tietojen katoamistapauksessa, on tietojen palautusprosessissa aina omat haasteensa. Onkin tärkeää valita työhön asiantuntija, jolla on aikaisempaa kokemusta vastaavanlaisesta palautusprosessista, tarvittavat työkalut, tai mahdollisuus kehittää niitä, ja riittävästi tietotaitoa.

Picture copyright: M.Großmann/pixelio.de

img_600x600_shirtontrack

Soita ja pyydä apua heti!