Syyt palvelinkeskuksen romahtamiseen

Syyt palvelinkeskuksen romahtamiseen

Dataoperaattorit tekevät joskus virheitä, jotka voivat johtaa koko palvelinkeskuksen sulkemiseen. Suurin osa näistä ongelmista voidaan kuitenkin välttää huoltotoimenpiteillä, tarkastusmenettelyillä sekä järjestelmänhaltijoiden terveellä järjellä ja kokemuksella.

"Suunniteltu datakeskuksen katkos" on kohtelias tapa puhua palvelinkeskuksen ongelmista, jotka johtavat seisokkiin. Olipa perimmäinen syy laitteisto-, ohjelmisto- tai inhimillinen virhe, useimmat näistä virheistä voidaan ja pitäisi estää etukäteen. Nykypäivän palvelinkeskuksissa vallitsevan korkean riskien redundanssin ansiosta onnettomuuksien ennaltaehkäisy on täysin mahdollista.

Mielenkiintoinen asia on se, että suuria ja pieniä virheitä voi silti tapahtua konesalissa koko ajan, ja palvelinkeskusten toiminnan lopettamisesta aiheutuvat vahingot eivät ole pieniä edes lyhyeksi ajaksi. Data Center Knowledgen tutkimuksen mukaan datakeskusten seisokit voivat maksaa yrityksille noin 7 900 dollaria minuutissa. Itse asiassa 93 % yrityksistä, joiden konesaleissa oli seisokkeja vähintään 10 päivää, meni konkurssiin vuoden sisällä, ja 40 % romahti välittömästi. Ja toisessa arvioidussa 41 palvelinkeskuksessa tehdyssä tutkimuksessa havaittiin, että suunnittelemattomien käyttökatkojen keskimääräiset kustannukset sisälsivät yli 179 000 dollaria liiketoiminnan keskeytyksiä, noin 118 000 dollaria menetettyjen tulojen ja noin 42 000 dollarin tuottavuuden. Jos palvelinkeskusten johtajat keskittyisivät vain enemmän yleisten virheiden tärkeimpien syiden tutkimiseen ja korjaamiseen, he vähentäisivät merkittävästi mahdollisia riskejä.

Syyt palvelinkeskuksen romahtamiseen

Ongelmana on, että monet konesalioperaattorit ja -operaattorit keskittyvät usein enemmän kasvuun ja liikevaihtoon sen sijaan, että ylläpitäisivät ja vahvistaisivat jo olemassa olevaa. Jos kiinnität huomiota monien julkisten ja yksityisten datakeskusten ylläpitäjiin nykyään, huomaat, että he ovat lähes yksinomaan huolissaan tallennuskapasiteetin lisäämisestä, palvelintiheyden lisäämisestä ja palvelintiheyden lisäämisestä. Asenna vanhentuneet palvelinfarmit nykyaikaisemmiksi ja tehokkaammiksi tiloiksi. esimerkiksi jäähdytysjärjestelmät. Vaikka tämä kaikki on hienoa, erittäin tarpeellista ja osoittaa uskomatonta kasvua tiedontallennusteollisuudessa, se osoittaa myös, miksi datakeskukset epäonnistuvat. Tapahtuu yhä yleisemmin.

Tässä artikkelissa tutkimme yleisiä syitä, miksi palvelinkeskukset poistetaan käytöstä, ja korostamme, mitä järjestelmänvalvojat voivat tehdä niiden minimoimiseksi tai jopa poistamiseksi. Voit korjata nämä ongelmat kokonaan ja parantaa järjestelmäsi vakautta.

Syyt palvelinkeskuksen romahtamiseen

Ihmisten aiheuttama virhe

Nämä ovat yksinkertaisimpia syitä ja myös yksi vaikeimmista välttää. Yksinkertaisesti sanottuna jokainen voi tehdä virheitä. Koska 22 % katkoksista johtuu inhimillisestä virheestä, tämä syy kannattaa harkita huolellisesti ja mikä tärkeintä, se voidaan estää suhteellisen helposti.

Virheellinen järjestelmän valtuutus

Syyt palvelinkeskuksen romahtamiseen

Todellisuudessa vain harvoilla järjestelmänvalvojilla on täysi ja rajoittamaton pääsy kaikkiin tietokeskuksen järjestelmiin. Sen sijaan, että tämä lupa myönnettäisiin useammalle ihmiselle, pääsyä on hallittava tiukasti. Muuten on täysin mahdollista, että järjestelmässä voi tapahtua vakava virhe. Esimerkiksi vuonna 2014 Joyent-tapahtumassa kokenut järjestelmänvalvoja käynnisti vahingossa uudelleen kaikki yrityksen itäisen datakeskuksen virtuaalikoneet vain muutamalla napsautuksella.

Huono varmuuskopiointimenettely

Syyt palvelinkeskuksen romahtamiseen

Ylläpitotehtäviä suunniteltaessa tärkeä, mutta usein unohdettu vaihe on varmuuskopiointi. Usein prosessit dokumentoidaan, mutta niitä ei tarkastella perusteellisesti, ja monta kertaa asioita ei palauteta kokonaan alkuperäiseen muotoonsa huollon jälkeen.

Liian monta muutosta

Syyt palvelinkeskuksen romahtamiseen

Jos järjestelmänvalvoja yrittää tehdä liian monta muutosta kerralla ylläpidon aikana, tämä voi aiheuttaa ongelmia. Ensinnäkin ylläpitäjillä on usein kiireinen mentaliteetti, koska heidän on suoritettava suuri määrä tehtäviä lyhyessä ajassa, mikä johtaa usein virheisiin. Toiseksi, koska niin monia muutoksia tapahtuu samalla aikavälillä, se tekee muutoksen jälkeisestä vianmäärityksestä paljon vaikeampaa.

Löysyys henkilöstöhallinnossa

Syyt palvelinkeskuksen romahtamiseen

Kuulostaa hieman ankaralta, mutta työntekijöiden tulee osata noudattaa tiukasti keskuksen sääntöjä ja heidän on oltava ankarasti kurissa niitä rikkoessaan. Esimerkiksi mikään datakeskus ei salli työntekijöiden syödä tai juoda työssään, tai hätäkytkimet on merkittävä selkeästi ja suojattava. Nämä asiat voivat tuntua pieniltä, ​​mutta voivat johtaa suuriin tapauksiin, joten varmista, että sääntöjä noudatetaan aina tiukasti.

Järjestelmävirhe

Varavirtaa ei taata, laite on vanha tai väärin konfiguroitu.

Syyt palvelinkeskuksen romahtamiseen

Yleisin syy datakeskuksen kaatumiseen on sähkökatkos. Sähkökatkoksia voi tapahtua milloin tahansa. Siksi datakeskukset on suunniteltu varavirtalähteillä siltä varalta, että päävirta katkeaa. Varavirtalähteenä käytetään usein akkuja tai generaattorijärjestelmiä. Ongelmana on, että akkua ei ehkä vaihdeta ajoissa, generaattoria ei ehkä tarkasteta ja huolleta, mikä johtaa ongelmiin sähkökatkon sattuessa. Kaikki tämä tarkoittaa, että varmuuskopiointiominaisuudet eivät välttämättä ole käytettävissä silloin, kun niitä eniten tarvitset.

Sähkökatkon sattuessa UPS-järjestelmät käyttävät akkuja varavirtalähteenä, joten ne ovat olennainen osa datakeskusten käytettävyyden ylläpitämistä. Akku ei kuitenkaan aina toimi kunnolla. Suorita valmistajan suosittelema huolto akun kunnon tarkistamiseksi. Akut on tarkastettava vähintään neljännesvuosittain oikean asennuksen, purkamisen ja latauksen varalta. Tämä sisältää visuaaliset tarkastukset, kapasiteetin tarkistukset ja säännöllisen valvonnan ohjelmiston tai itse UPS-toimittajan kautta.

Lisäksi korkeat lämpötilat voivat lyhentää järjestelmän akun käyttöikää. Oman UPS-huoneen rakentaminen voi auttaa vähentämään akun käyttöiän kulumista. Vältä myös akun purkamista usein ja huolehdi löysistä liitännöistä tai kuluneista liittimistä. Lyhyesti sanottuna UPS on erityisen tärkeä järjestelmä, se vaatii järkevää suunnittelua, asianmukaista käyttöä ja tiukkaa huoltoa.

Vika jäähdytysjärjestelmässä

Syyt palvelinkeskuksen romahtamiseen

Palvelinkeskuksen mekaaniset järjestelmät kuluttavat paljon sähköä, mikä tarkoittaa, että niistä vapautuu paljon lämpöä toimiessaan. Palvelinkeskuksesta voi tulla krematorio minuutin käytön jälkeen. Siksi jäähdytysjärjestelmä on niin tärkeä. Ja vaikka lämpötila-anturit lukevat ja järjestelmänvalvojille lähetetään hälytyksiä, sinun on varmistettava, että sinulla on tarpeeksi aikaa toteuttaa keskuksen varajäähdytystoimet, ennen kuin kaikki sulaa.

Lisäksi monia jäähdytysjärjestelmiä ei oikeastaan ​​ole suunniteltu pysymään nykyaikaisen suuren kapasiteetin datakeskuksen kohonneiden lämpötasojen kanssa. Jälleen tilanteiden kartoittaminen, joissa palvelinkeskuksesi toimii 100 % kapasiteetilla, voi auttaa suunnittelemaan parempia jäähdytysjärjestelmiä tulevaisuudessa. Varoitusjärjestelmien asentaminen järjestelmän lämpötilan vaihteluille on myös tarpeen. Voit käyttää joitain lämpömallinnusohjelmistoja ja joitain DCIM-järjestelmiä. Lisäksi kemialliset kylmäaineet ovat parempi valinta kuin vesipohjaiset järjestelmät.

Automaattinen muunnosprosessi ei toimi kunnolla

Syyt palvelinkeskuksen romahtamiseen

Useimmilla palveluntarjoajilla ja organisaatioilla ja yrityksillä on varmuuskopiointikeskuksia, joita käytetään tuotantotietokeskuksiin. Ensisijaisen datakeskuksen sähkökatkoksen sattuessa varatietokeskus käynnistyy automaattisesti ja kaikki liikenne reititetään kyseiseen varakeskukseen. Oikein tehtynä prosessin tulee olla saumaton aina loppukäyttäjään asti. Valitettavasti automaattiset vikasiirrot eivät usein toimi odotetulla tavalla. Tavallinen syy tähän ongelmaan on säännöllisen testauksen puute. Pienilläkin tuotantoinfrastruktuurin muutoksilla voi olla suuri vaikutus automatisoituun vikasietoon. Siksi, kun infrastruktuuriin tehdään muutoksia, automaattiset vikasietotoimenpiteet on testattava, jotta varmistetaan, että mikään ei ole poikennut prosessista.

Vanhentunut laitteisto

Syyt palvelinkeskuksen romahtamiseen

Jokaisen järjestelmän kaikilla laitteistoilla on tietty käyttöikä. Ja mitä kauemmin käytät laitteistoa, sitä todennäköisemmin kohtaat ongelmia. Kaikki tietävät tämän, mutta on yleistä, että tärkeä sovellus kaatuu vain siksi, että se toimii 10 vuotta vanhalla laitteistolla. Nämä ongelmat johtuvat usein uusien laitteisto- tai ohjelmistoalustojen kattavien korvaus- ja päivityssuunnitelmien puutteesta tai budjetin puutteesta. Jos se on rahakysymys, et voi tehdä mitään. Mutta jos yrität vain hyödyntää mahdollisimman pitkään, ongelma voi tapahtua milloin tahansa, ja kun se tapahtuu, ongelman aiheuttama vahinko voi olla paljon suurempi.

Palonsammutusjärjestelmässä on vesivuotoongelma

Syyt palvelinkeskuksen romahtamiseen

Useimmat nykyaikaiset palvelinkeskukset käyttävät vedettömiä palontorjuntajärjestelmiä, jotta ne eivät vahingoita laitteita, jos ne aktivoituvat tarkoituksella tai vahingossa. Mutta monet vanhemmat tilat käyttävät edelleen perinteisiä palontorjuntajärjestelmiä palvelinkeskuksissaan. Monet vesivuodot ovat aiheuttaneet suuria katkoksia.

Hätäsammutus aktivoituu vahingossa

Syyt palvelinkeskuksen romahtamiseen

Useimmissa palvelinkeskuksissa vallitseva korkea fyysisen turvallisuuden taso ei pelkästään pelota varkaita. Ne ovat myös käytössä työntekijöiden välttämiseksi, jotka eivät ymmärrä palvelinkeskuksen toimintaa. Esimerkiksi sovelluksen järjestelmänvalvoja kävelee palvelinkeskukseen ja laukaisee vahingossa hätävirrankatkaisun (EPO). EPO on suuri punainen painike, joka vastaa koko järjestelmän virran katkaisemisesta. Ja ilmeisesti niille, jotka eivät ymmärrä tai joilla ei ole asiantuntemusta, tällainen hämmennys on täysin mahdollista.

Kyberhyökkäyksen alla, ddos

Syyt palvelinkeskuksen romahtamiseen

Kyberhyökkäykset ovat vuosien saatossa nousseet yhdeksi johtavista datakeskusten toimintahäiriöiden syistä, vain 2 prosentista vuonna 2010 22 prosenttiin vuonna 2016. Operaattorit Tietokeskusten on ryhdyttävä toimiin järjestelmien perustamiseksi hyökkäysten riskien havaitsemiseksi ja vähentämiseksi varhaisessa vaiheessa.

Palvelinkeskuksia on vaikea puolustaa laajamittaista DDoS-hyökkäystä vastaan. Useimmat Internet-palveluntarjoajat tarjoavat jonkin verran suojaa verkon kerroksilla 3 ja 4, mutta palvelusi tarvitsevat lisäsuojaa tasolla 7, joka voidaan kohdistaa erityisesti HTTP GET:n tai puheluiden kautta. Lieventämispalveluita, kuten palomuurit, IPS/IDS ja DDoS, voidaan yhdistää liikenteen uudelleenreitittämiseen.

Luonnonmullistus

Viimeaikainen myrskyjen ja tulvien lisääntyminen voi aiheuttaa merkittäviä häiriöitä datakeskuksissa. Vuonna 2010 Yhdysvalloissa tapahtui yli 250 luonnonkatastrofia. Tilastojen mukaan USA:n New Jerseyn osavaltio kärsi 63,9 miljardin dollarin tappiot Sandy-supermyrskyn aiheuttaman liiketoiminnan keskeytymisen vuoksi vuonna 2012.

Toimenpiteet palvelinkeskuksen "romahtamisesta" aiheutuvien vahinkojen rajoittamiseksi

Jos rutiinihuollon seisokit suunnitellaan huolellisesti ja asiakkaita varoitetaan etukäteen keskuksen seisokeista varsinkin vähäliikenteisenä aikana, asiakkaat ovat myötätuntoisempia ja vahingot vähenevät merkittävästi. Suurin vahinko syntyy, kun se tapahtuu odottamatta, ja varsinkin jos se kestää pitkään, ja lisäongelmia syntyy. Pidä koko yrityksen resurssijärjestelmä vakaana, jotta työntekijät voivat tehdä työnsä tehokkaasti, mikä vähentää IT-osastojen taakkaa.

Erityisesti:

  • Varmuuskopioi tietosi: Jos kohtaat datakeskuksen käyttökatkon, tietosi (ja mikä tärkeintä asiakkaidesi tietojen) pitäisi olla valmiina, kun aloitat. Aloita vianetsintä ja suorita uudelleen. Säännöllinen varmuuskopiointi rajoittaa todellisen romahduksen riskiä. Jos yritykselläsi on siihen varaa, jotkin tuotteet, kuten EMC:n VPLEX-tuotelinja tai VEEAM:n varmuuskopiointi- ja replikointiohjelmisto, voivat auttaa minimoimaan seisokkeja vaihtamalla automaattisesti paikkaan.
  • Ylläpidä palvelinjärjestelmän säännöllistä valvontaa: Valvonta on palvelu, jota voit suorittaa säännöllisesti ja joka ei yleensä maksa liikaa. Kolmannen osapuolen valvontapalvelu ilmoittaa sinulle mahdollisista palvelimen seisokeista, jotta voit hoitaa ongelman välittömästi.
  • Minimoi inhimilliset virheet: Ole varovainen työskennellessäsi tai kävellessäsi palvelinjärjestelmissä tai sähköjohdoissa, jotta vältyt vahingossa vahingoittamasta niitä, tai älä yksinkertaisesti koske salaperäisiin kytkimiin ilman asiantuntemustasi. Pidä nesteet poissa mekaanisista järjestelmistä. Soita tietosuojaasiantuntijalle aina, kun palvelin tarvitsee päivitystä tai huoltoa, ja noudata keskuksen sääntöjä.

Jokaisen palvelinkeskuksen, pienistä keskuksista yrityskokoisiin tiloihin ja palveluntarjoajiin, on pyrittävä 100-prosenttisesti tarjoamaan luotettavia palveluja käyttäjille. Varaamalla aikaa tulevaisuuden suunnitteluun, huollon ja inhimillisten tekijöiden periaatteita noudattaen, palvelinkeskuksesi voi välttää jotkin yleisimmistä vikojen syistä.

Katso lisää


Asenna dynaamisia näyttöjä ja animoituja taustakuvia Windowsiin

Asenna dynaamisia näyttöjä ja animoituja taustakuvia Windowsiin

Microsoftin Windows Vista -käyttöjärjestelmässä DreamScene salli dynaamisten taustojen asettamisen tietokoneille, mutta kahdeksan vuotta myöhemmin se ei ole vieläkään saatavilla Windows 10:ssä. Miksi tämä tapa on ollut paluu menneisyyteen vuosien ajan, ja mitä voimme tehdä muuttaaksemme tämän?

Kuinka yhdistää verkko kahden kannettavan tietokoneen välille verkkokaapelilla

Kuinka yhdistää verkko kahden kannettavan tietokoneen välille verkkokaapelilla

Jos haluamme liittää kaksi kannettavaa tietokonetta verkkoon, voimme käyttää verkkokaapelia ja vaihtaa sitten kahden tietokoneen IP-osoitteet ja siinä kaikki.

Korjausohjeet Sinulla ei ole lupaa tallentaa tähän sijaintiin Windowsissa

Korjausohjeet Sinulla ei ole lupaa tallentaa tähän sijaintiin Windowsissa

Kun Windows näyttää virheilmoituksen "Sinulla ei ole lupaa tallentaa tähän sijaintiin", tämä estää sinua tallentamasta tiedostoja haluttuihin kansioihin.

Paras ilmainen ja maksullinen Syslog Server -ohjelmisto Windowsille

Paras ilmainen ja maksullinen Syslog Server -ohjelmisto Windowsille

Syslog Server on tärkeä osa IT-järjestelmänvalvojan arsenaalia, varsinkin kun on kyse tapahtumalokien hallinnasta keskitetyssä paikassa.

Mikä on Error 524 A Timeout Occurred ja kuinka korjata virhe

Mikä on Error 524 A Timeout Occurred ja kuinka korjata virhe

Virhe 524: Aikakatkaisu tapahtui on Cloudflare-kohtainen HTTP-tilakoodi, joka ilmaisee, että yhteys palvelimeen katkesi aikakatkaisun vuoksi.

Mikä on virhe 0x80070570? Kuinka korjata tämä virhe?

Mikä on virhe 0x80070570? Kuinka korjata tämä virhe?

Virhekoodi 0x80070570 on yleinen virheilmoitus tietokoneissa, kannettavissa tietokoneissa ja tableteissa, joissa on Windows 10 -käyttöjärjestelmä. Se näkyy kuitenkin myös tietokoneissa, joissa on Windows 8.1, Windows 8, Windows 7 tai vanhempi.

Ohjeet sinisen näytön virheen korjaamiseen PAGE FAULT IN PAGED AREA tai STOP 0x00000050

Ohjeet sinisen näytön virheen korjaamiseen PAGE FAULT IN PAGED AREA tai STOP 0x00000050

Blue screen of death -virhe BSOD PAGE_FAULT_IN_NONPAGED_AREA tai STOP 0x00000050 on virhe, joka ilmenee usein laitteisto-ajurin asennuksen tai uuden ohjelmiston asennuksen tai päivityksen jälkeen, ja joissakin tapauksissa syynä on, että virhe johtuu korruptoituneesta NTFS-osiosta.

Mitä tehdä, kun saat Video Schedulerin sisäisen virheen?

Mitä tehdä, kun saat Video Schedulerin sisäisen virheen?

Video Scheduler Internal Error on myös tappava sininen näyttövirhe, tämä virhe ilmenee usein Windows 10:ssä ja Windows 8.1:ssä. Tämä artikkeli näyttää joitakin tapoja korjata tämä virhe.

Kuinka estää Epic Launcherin käynnistyminen Windowsin kanssa

Kuinka estää Epic Launcherin käynnistyminen Windowsin kanssa

Voit nopeuttaa Windows 10:n käynnistystä ja lyhentää käynnistysaikaa noudattamalla alla olevia ohjeita poistaaksesi Epicin Windowsin käynnistyksestä ja estääksesi Epic Launcherin käynnistymisen Windows 10:n kanssa.

3 parempaa tapaa tallentaa tiedostoja työpöydälle

3 parempaa tapaa tallentaa tiedostoja työpöydälle

Sinun ei pitäisi tallentaa tiedostoja työpöydälle. On olemassa parempia tapoja tallentaa tietokonetiedostoja ja pitää työpöytäsi siistinä. Seuraava artikkeli näyttää sinulle tehokkaampia paikkoja tiedostojen tallentamiseen Windows 10:ssä.