Vzroki za propad podatkovnega centra

Vzroki za propad podatkovnega centra

Podatkovni operaterji včasih naredijo napake, ki lahko privedejo do zaprtja celotnega podatkovnega centra. Večini teh težav pa se je mogoče izogniti z vzdrževalnimi ukrepi, inšpekcijskimi postopki ter z zdravo pametjo in izkušnjami sistemskih operaterjev.

"Nenačrtovan izpad podatkovnega centra" je vljuden način govora o tem, da ima podatkovni center težave, ki vodijo do izpadov. Ne glede na to, ali je glavni vzrok napaka strojne opreme, napaka programske opreme ali človeška napaka, je večino teh napak mogoče in bi bilo treba preprečiti vnaprej. Z visoko stopnjo redundance tveganja v današnjih podatkovnih centrih je preprečitev incidentov vnaprej povsem možna.

Zanimiva stvar je, da se v podatkovnem centru še vedno lahko ves čas pojavljajo velike in majhne napake, škoda, ki nastane, ko podatkovni centri prenehajo delovati, pa tudi za kratek čas ni majhna. Glede na študijo Data Center Knowledge lahko izpad podatkovnega centra podjetja stane približno 7.900 USD na minuto. Pravzaprav je 93 % podjetij z izpadi podatkovnih centrov 10 dni ali več bankrotiralo v enem letu, 40 % pa jih je takoj propadlo. In druga študija 41 ocenjenih podatkovnih centrov je pokazala, da povprečni stroški nenačrtovanih izpadov vključujejo več kot 179 tisoč dolarjev prekinitve poslovanja, približno 118 tisoč dolarjev izgubljenega prihodka in približno 42 tisoč dolarjev produktivnosti. Če bi se upravitelji podatkovnih centrov preprosto bolj osredotočili na raziskovanje in odpravljanje glavnih vzrokov pogostih napak, bi znatno zmanjšali potencialna tveganja.

Vzroki za propad podatkovnega centra

Težava je v tem, da se številni operaterji podatkovnih centrov in operaterji pogosto bolj osredotočajo na rast in prihodke, namesto da bi vzdrževali in krepili že obstoječe. Če ste danes pozorni na administratorje v številnih javnih in zasebnih podatkovnih centrih, boste videli, da se skoraj izključno ukvarjajo s povečanjem zmogljivosti shranjevanja, povečanjem gostote strežnikov in večjo gostoto strežnikov. hladilni sistemi, na primer. Čeprav je vse to odlično, zelo potrebno in kaže neverjetno rast v industriji shranjevanja podatkov, kaže tudi, zakaj podatkovni centri propadajo, kar se dogaja vse pogosteje.

V tem članku bomo raziskali pogoste razloge, zakaj so podatkovni centri onemogočeni, in poudarili, kaj lahko skrbniki storijo, da jih zmanjšajo ali celo odpravijo. popolnoma odpraviti te težave in izboljšati stabilnost vašega sistema.

Vzroki za propad podatkovnega centra

Napaka, ki jo povzročijo ljudje

To so najpreprostejši vzroki in tudi eni izmed najtežje izogniti se jim. Preprosto povedano, vsak se lahko zmoti. Pri 22 % izpadov, ki jih povzroči človeška napaka, je ta vzrok vreden skrbnega premisleka in, kar je pomembno, relativno enostavno ga je mogoče preprečiti.

Nepravilna sistemska avtorizacija

Vzroki za propad podatkovnega centra

V resnici ima zelo malo skrbnikov popoln in neomejen dostop do vseh sistemov v podatkovnem centru. Namesto da bi to dovoljenje podelili več ljudem, je treba dostop skrbno upravljati. V nasprotnem primeru je povsem možno, da pride do resne napake v sistemu. Na primer, v incidentu Joyent leta 2014 je izkušeni skrbnik pomotoma znova zagnal vse virtualne stroje v vzhodnem podatkovnem centru podjetja z le nekaj kliki.

Slabi postopki varnostnega kopiranja

Vzroki za propad podatkovnega centra

Pri načrtovanju vzdrževalnih nalog je pomemben, a pogosto pozabljen korak postopek varnostnega kopiranja. Pogosto so procesi dokumentirani, vendar ne temeljito pregledani, velikokrat pa stvari po vzdrževanju niso povsem povrnjene v prvotno obliko.

Preveč sprememb

Vzroki za propad podatkovnega centra

Če skrbnik med vzdrževanjem poskuša izvesti preveč sprememb hkrati, lahko to povzroči težave. Prvič, skrbniki imajo pogosto miselnost naglice, ker morajo opraviti veliko število nalog v kratkem času, kar pogosto vodi do napak. Drugič, ker se v istem časovnem okviru zgodi toliko sprememb, je odpravljanje težav po spremembi veliko težja naloga.

Ohlapnost pri upravljanju človeških virov

Vzroki za propad podatkovnega centra

Sliši se nekoliko ostro, a zaposleni se morajo znati dosledno držati pravil v centru in morajo biti ob kršenju le-teh strogo disciplinirani. Na primer, nobeno podatkovno središče zaposlenim ne dovoljuje jesti ali piti med delom ali pa morajo biti stikala v sili jasno označena in zavarovana. Te stvari se morda zdijo majhne, ​​vendar lahko privedejo do večjih incidentov, zato poskrbite, da se pravila vedno dosledno upoštevajo.

Sistemska napaka

Rezervno napajanje ni zagotovljeno, oprema je stara ali napačno konfigurirana.

Vzroki za propad podatkovnega centra

Najpogostejši razlog za okvaro podatkovnega centra je izpad električne energije. Izpad električne energije se lahko zgodi kadar koli. Zato so podatkovni centri zasnovani z rezervnimi viri napajanja v primeru izpada glavnega napajanja. Za rezervno napajanje se pogosto uporabljajo baterije ali generatorski sistemi. Težava je v tem, da baterija morda ni pravočasno zamenjana, generator morda ni pregledan in vzdrževan, kar povzroči težave, ko pride do izpada električne energije. Vse to pomeni, da vaše zmogljivosti za varnostno kopiranje morda ne bodo na voljo, ko jih najbolj potrebujete.

V primeru izpada električne energije sistemi UPS uporabljajo baterije kot rezervno napajanje, zaradi česar so bistveni del vzdrževanja delovanja podatkovnih centrov. Vendar baterija ne deluje vedno dobro. Opravite vzdrževanje, ki ga priporočajo proizvajalci sami, da preverite zdravje baterije. Vsaj enkrat na četrtletje je treba akumulatorje pregledati glede pravilne namestitve, praznjenja in polnjenja. To vključuje vizualne preglede, preverjanja zmogljivosti in redno spremljanje prek programske opreme ali samega dobavitelja UPS.

Poleg tega lahko visoke temperature skrajšajo življenjsko dobo baterije sistema. Z izgradnjo namenske sobe za UPS lahko zmanjšate obrabo baterije. Izogibajte se tudi pogostemu praznjenju baterije in dobro pazite na ohlapne povezave ali obrabljene priključke. Skratka, UPS je še posebej pomemben sistem, ki zahteva razumno zasnovo, pravilno uporabo in strogo vzdrževanje.

Okvara v hladilnem sistemu

Vzroki za propad podatkovnega centra

Mehanski sistemi v podatkovnem centru porabijo veliko električne energije, kar pomeni, da med delovanjem oddajajo veliko količino toplote. Podatkovni center lahko po eni minuti delovanja postane krematorij. Zato je hladilni sistem tako pomemben. In tudi če imate odčitavanje temperaturnih senzorjev in opozorila poslana skrbnikom, morate biti prepričani, da imate dovolj časa za izvedbo rezervnih postopkov hlajenja centra, preden se vse stopi.

Poleg tega številni hladilni sistemi v resnici niso zasnovani tako, da bi dohajali povečane ravni toplote v sodobnem visokozmogljivem podatkovnem centru. Spet lahko načrtovanje situacij, v katerih vaš podatkovni center deluje s 100-odstotno zmogljivostjo, pomaga pri načrtovanju boljših hladilnih sistemov v prihodnosti. Nujna je tudi postavitev opozorilnih sistemov za temperaturna nihanja sistema. Uporabite lahko nekaj programske opreme za toplotno modeliranje in nekaj sistemov DCIM. Poleg tega so kemična hladilna sredstva boljša izbira kot sistemi na vodni osnovi.

Samodejni postopek pretvorbe ne deluje pravilno

Vzroki za propad podatkovnega centra

Večina ponudnikov storitev ter organizacij in podjetij ima rezervne podatkovne centre, ki se uporabljajo za proizvodne podatkovne centre. V primeru izpada električne energije v primarnem podatkovnem centru se bo samodejno zagnal rezervni podatkovni center in ves promet bo preusmerjen na ta rezervni objekt. Če je izveden pravilno, bi moral biti postopek brezhiben vse do končnega uporabnika. Na žalost samodejni preklopi ob napakah pogosto ne delujejo po pričakovanjih. Običajni vzrok za to težavo je pomanjkanje rednega testiranja. Celo majhne spremembe v proizvodni infrastrukturi imajo lahko velik vpliv na samodejno preklop v primeru napake. Zato bo treba pri kakršnih koli spremembah infrastrukture preizkusiti samodejne postopke preklopa, da se zagotovi, da nič ne odstopa od procesa.

Zastarela strojna oprema

Vzroki za propad podatkovnega centra

Vsa strojna oprema vsakega sistema ima določeno življenjsko dobo. In dlje kot uporabljate kos strojne opreme, večja je verjetnost, da boste naleteli na težave. Vsi to vedo, vendar je običajno, da se pomembna aplikacija zruši samo zato, ker deluje na 10 let stari strojni opremi. Te težave pogosto nastanejo zaradi pomanjkanja celovitih načrtov za zamenjavo in nadgradnjo novih platform strojne ali programske opreme ali zaradi pomanjkanja proračuna. Če gre za denar, ne moreš nič narediti. A če preprosto poskušate izkoriščati čim dlje, se lahko kadarkoli zgodi težava, in ko se zgodi, je lahko škoda, ki jo povzroči težava, veliko večja.

Sistem za gašenje požara ima težave z puščanjem vode

Vzroki za propad podatkovnega centra

Večina sodobnih podatkovnih centrov uporablja brezvodne protipožarne sisteme, tako da ne poškodujejo opreme, če so aktivirani namenoma ali po nesreči. Toda veliko starejših objektov še vedno uporablja tradicionalne sisteme protipožarne zaščite v svojih podatkovnih centrih. Številna puščanja vode so povzročila velike izpade.

Zasilni izklop je nenamerno aktiviran

Vzroki za propad podatkovnega centra

Visoka stopnja fizične varnosti v večini podatkovnih centrov ne odvrne le tatov. Namenjeni so tudi izogibanju zaposlenim, ki ne razumejo delovanja podatkovnega centra. Na primer, skrbnik aplikacije vstopi v podatkovni center in pomotoma sproži izklop v sili (EPO). EPO je velik rdeči gumb, odgovoren za izklop napajanja celotnega sistema. In očitno je za tiste, ki ne razumejo ali nimajo strokovnega znanja, takšna zmeda povsem možna.

Pod kibernetskim napadom, ddos

Vzroki za propad podatkovnega centra

Z leti so kibernetski napadi postali eden glavnih vzrokov za okvare podatkovnih centrov, s samo 2 % leta 2010 na 22 % leta 2016. Operaterji podatkovnih centrov morajo ukrepati, da vzpostavijo sisteme za zgodnje odkrivanje in zmanjšanje tveganja napadov.

Podatkovne centre je težko ubraniti pred obsežnimi napadi DDoS . Večina ponudnikov internetnih storitev zagotavlja določeno zaščito na slojih 3 in 4 omrežja, vendar vaše storitve potrebujejo dodatno zaščito na sloju 7, ki je lahko posebej ciljno usmerjena prek HTTP GET ali klicev. Storitve ublažitve, kot so požarni zidovi, IPS/IDS in DDoS, je mogoče kombinirati za preusmeritev prometa.

Naravna katastrofa

Nedavno povečanje neurij in poplav lahko povzroči znatne motnje v podatkovnih centrih. Leta 2010 se je v ZDA zgodilo več kot 250 naravnih nesreč. Po statističnih podatkih je zvezna država New Jersey v ZDA utrpela 63,9 milijarde dolarjev izgube zaradi prekinitve poslovanja, ki jo je povzročila supernevihta Sandy leta 2012.

Koraki za omejitev škode, ki jo povzročijo incidenti "zrušitve" podatkovnega centra

Če so izpadi zaradi rednega vzdrževanja skrbno načrtovani in so stranke vnaprej opozorjene na izpade centra, zlasti v obdobju nizkega prometa, bodo stranke bolj naklonjene in škoda se bo znatno zmanjšala. Največja škoda nastane, ko se pojavi nepričakovano, predvsem pa, če traja dolgo, in se pojavijo dodatne težave. Ohranjajte celoten sistem virov podjetja stabilen, da lahko zaposleni učinkovito opravljajo svoje delo, kar zmanjša obremenitev IT oddelkov.

Natančneje:

  • Varnostno kopirajte svoje podatke: Če se soočite z izpadom podatkovnega centra, morajo biti vaši podatki (in kar je še pomembneje, podatki vaših strank) pripravljeni, ko začnete. Začnite odpravljati težave in zaženite znova. Izvajanje rednih varnostnih kopij omeji tveganje resničnega zloma. Če si vaše podjetje to lahko privošči, lahko nekateri izdelki, kot je EMC-jeva linija izdelkov VPLEX ali VEEAM-ova programska oprema za varnostno kopiranje in replikacijo, pomagajo zmanjšati izpade s samodejnim preklopom na lokacijo.
  • Vzdržujte redno spremljanje strežniškega sistema: Nadzor je storitev, ki jo lahko izvajate redno in običajno ne stane preveč. Storitev spremljanja tretje osebe vas obvesti o morebitnem izpadu strežnika, tako da lahko težavo odpravite takoj.
  • Zmanjšajte človeške napake: Bodite previdni, ko delate ali hodite okoli strežniških sistemov ali električnih napeljav, da jih nenamerno poškodujete, ali pa se preprosto ne dotikajte skrivnostnih stikal brez svojega znanja. Tekočine hranite stran od mehanskih sistemov. Pokličite strokovnjaka za varstvo podatkov vsakič, ko je strežnik treba nadgraditi ali vzdrževati, in upoštevajte pravila centra.

Vsak podatkovni center, od majhnih centrov do velikih podjetij in ponudnikov storitev, si mora 100 % prizadevati za zagotavljanje zanesljivih storitev uporabnikom. Če si vzamete čas za načrtovanje prihodnosti, upoštevate načela vzdrževanja in človeških dejavnikov, se lahko vaš podatkovni center izogne ​​nekaterim najpogostejšim vzrokom napak.

Poglej več


Več o požarnih zidovih, požarni zid Windows v sistemu Windows Server 2012

Več o požarnih zidovih, požarni zid Windows v sistemu Windows Server 2012

Požarni zid Windows z napredno varnostjo je požarni zid, ki deluje v sistemu Windows Server 2012 in je privzeto omogočen. Nastavitve požarnega zidu v sistemu Windows Server 2012 se upravljajo v Microsoftovi konzoli za upravljanje požarnega zidu Windows.

Kako spremeniti geslo za prijavo v modem in usmerjevalnik Vigor Draytek

Kako spremeniti geslo za prijavo v modem in usmerjevalnik Vigor Draytek

Pri spreminjanju skrbniškega gesla za prijavo modema in usmerjevalnika Vigor Draytek bodo uporabniki omejili nepooblaščen dostop do spremembe gesla za modem in s tem zavarovali pomembne omrežne informacije.

Kako enostavno pospešiti RAM z AMD Ryzen Master

Kako enostavno pospešiti RAM z AMD Ryzen Master

Na srečo lahko uporabniki računalnikov z operacijskim sistemom Windows s procesorji AMD Ryzen uporabljajo Ryzen Master za enostavno overklokiranje RAM-a, ne da bi se dotaknili BIOS-a.

7 načinov za odpravo napak prenosnika Windows, ki se ne polni prek USB-C

7 načinov za odpravo napak prenosnika Windows, ki se ne polni prek USB-C

Vrata USB-C so postala standard za prenos podatkov, video izhod in polnjenje na sodobnih prenosnikih Windows. Čeprav je to priročno, je lahko frustrirajoče, ko prenosni računalnik priključite na polnilnik USB-C in se ne polni.

Kako odpraviti napako Cannot Create Service v Ultraviewerju

Kako odpraviti napako Cannot Create Service v Ultraviewerju

Napaka Cannot Create Service na Ultraviewerju se pojavi, ko namestimo programsko opremo s kodo napake 1072.

Kako odpraviti napako, da ID ni prikazan na Ultraviewerju

Kako odpraviti napako, da ID ni prikazan na Ultraviewerju

Napaka, da ID na Ultraviewerju ni prikazan, bo vplivala na povezavo z oddaljenim računalnikom.

Kako uporabljati Ultraviewer za pošiljanje in prejemanje datotek

Kako uporabljati Ultraviewer za pošiljanje in prejemanje datotek

Ultraviewer nadzoruje računalnik na daljavo in ima način za pošiljanje in prejemanje datotek.

6 načinov za trajno brisanje datotek v sistemu Windows

6 načinov za trajno brisanje datotek v sistemu Windows

Običajno se pri brisanju datoteke v sistemu Windows datoteka ne izbriše takoj, ampak se shrani v koš. Po tem boste morali narediti še en korak: izprazniti smeti. Če pa tega drugega koraka ne želite narediti, vam bomo v spodnjem članku pokazali, kako trajno izbrisati datoteko.

Kako temni splet vpliva na varnost?

Kako temni splet vpliva na varnost?

Temni splet je skrivnostno mesto s slavnim slovesom. Iskanje temnega spleta ni težko. Druga stvar pa je naučiti se varno krmariti, še posebej, če ne veste, kaj počnete ali kaj lahko pričakujete.

Kaj je virus Adrozek? Kako se zaščititi pred virusom Adrozek

Kaj je virus Adrozek? Kako se zaščititi pred virusom Adrozek

Tehnično Adrozek ni virus. Je ugrabitelj brskalnika, znan tudi kot modifikator brskalnika. To pomeni, da je bila zlonamerna programska oprema nameščena v vaš računalnik brez vaše vednosti.