Az adatközpont összeomlásához vezető okok

Az adatközpont összeomlásához vezető okok

Az adatkezelők néha olyan hibákat követnek el, amelyek a teljes adatközpont leállásához vezethetnek. A legtöbb probléma azonban elkerülhető karbantartási intézkedésekkel, ellenőrzési eljárásokkal, valamint a rendszerüzemeltetők józan ésszel és tapasztalatával.

A „nem tervezett adatközpont-kimaradás” udvarias módja annak, hogy egy adatközpontban olyan problémák merülnek fel, amelyek leálláshoz vezetnek. Függetlenül attól, hogy a kiváltó ok hardverhiba, szoftverhiba vagy emberi hiba, ezeknek a hibáknak a többségét előre meg lehet és kell is megelőzni. A mai adatközpontokban alkalmazott magas kockázati redundancia révén az incidensek előzetes megelőzése teljesen lehetséges.

Érdekesség, hogy egy adatközpontban továbbra is állandóan előfordulhatnak kisebb-nagyobb hibák, és az adatközpontok működésének leállása sem csekély, akár csak egy percre sem. A Data Center Knowledge tanulmánya szerint az adatközponti leállások percenként körülbelül 7900 dollárba kerülhetnek a vállalkozásoknak. Valójában a 10 vagy több napig tartó adatközpontokkal rendelkező cégek 93%-a egy éven belül csődbe ment, 40%-uk pedig azonnal összeomlott. Egy másik, 41 adatközpontot vizsgáló tanulmány pedig azt találta, hogy a nem tervezett leállások átlagos költsége több mint 179 ezer dollárt tartalmazott az üzleti megszakításokból, körülbelül 118 ezer dollár bevételkiesésből és körülbelül 42 ezer dolláros termelékenységből. Ha az adatközpontok vezetői egyszerűen inkább a gyakori hibák fő okainak kutatására és kijavítására összpontosítanának, jelentősen csökkentenék a lehetséges kockázatokat.

Az adatközpont összeomlásához vezető okok

A probléma az, hogy sok adatközpont-üzemeltető és üzemeltető gyakran inkább a növekedésre és a bevételre összpontosít, ahelyett, hogy fenntartaná és megerősítené a már meglévőt. Ha manapság sok nyilvános és magán adatközpont adminisztrátoraira figyel, láthatja, hogy szinte kizárólag a tárolókapacitás növelésével, a szerversűrűség növelésével és a szerversűrűség növelésével foglalkoznak. Az elavult szerverfarmok utólagos felszerelése korszerűbb és hatékonyabb létesítményekké hűtőrendszerek például. Noha mindez nagyszerű, nagy szükség van rá, és hihetetlen növekedést mutat az adattárolási iparágban, azt is megmutatja, miért hibáznak az adatközpontok.

Ebben a cikkben megvizsgáljuk az adatközpontok letiltásának gyakori okait, és rávilágítunk arra, hogy a rendszergazdák mit tehetnek ezek minimalizálása vagy akár megszüntetése érdekében.

Az adatközpont összeomlásához vezető okok

Ember által okozott hiba

Ezek a legegyszerűbb okok, és az egyik legnehezebben elkerülhető okok. Egyszerűen fogalmazva, mindenki hibázhat. Mivel a kimaradások 22%-a emberi mulasztásra vezethető vissza, ezt az okot érdemes alaposan mérlegelni, és ami fontos, viszonylag könnyen megelőzhető.

Nem megfelelő rendszerengedélyezés

Az adatközpont összeomlásához vezető okok

Valójában nagyon kevés adminisztrátor rendelkezik teljes és korlátlan hozzáféréssel az adatközpontok összes rendszeréhez. Ahelyett, hogy ezt az engedélyt több embernek adnák meg, a hozzáférést szigorúan kezelni kell. Ellenkező esetben teljesen lehetséges, hogy komoly hiba léphet fel a rendszerben. Például a 2014-es Joyent-incidensben egy tapasztalt rendszergazda véletlenül néhány kattintással újraindította az összes virtuális gépet a cég keleti adatközpontjában.

Rossz biztonsági mentési eljárások

Az adatközpont összeomlásához vezető okok

A karbantartási feladatok tervezésénél fontos, de gyakran elfelejtett lépés a biztonsági mentés folyamata. A folyamatokat gyakran dokumentálják, de nem vizsgálják át alaposan, és sokszor a karbantartás után sem állnak vissza teljesen eredeti formájukba.

Túl sok változtatás végrehajtása

Az adatközpont összeomlásához vezető okok

Ha karbantartás közben egy rendszergazda túl sok módosítást próbál végrehajtani egyszerre, az problémákat okozhat. Először is, az adminisztrátorok gyakran rohanó mentalitásúak, mert sok feladatot kell rövid időn belül elvégezniük, ami gyakran hibákhoz vezet. Másodszor, mivel sok változás történik ugyanabban az időkeretben, ez sokkal nehezebbé teszi a változtatások utáni hibaelhárítást.

Lazaság az emberi erőforrás menedzsmentben

Az adatközpont összeomlásához vezető okok

Kicsit durván hangzik, de az alkalmazottaknak tudniuk kell, hogyan kell szigorúan betartani a központ szabályait, és szigorúan fegyelmezettnek kell lenniük, ha megszegik őket. Például egyetlen adatközpont sem engedi meg az alkalmazottaknak, hogy munka közben enjenek vagy igyanak, vagy a vészkapcsolókat egyértelműen fel kell címkézni és rögzíteni kell. Ezek apróságoknak tűnhetnek, de komoly eseményekhez vezethetnek, ezért ügyeljen arra, hogy a szabályokat mindig szigorúan betartsa.

Rendszer hiba

A tartalék tápellátás nem garantált, a berendezés régi vagy rosszul van beállítva.

Az adatközpont összeomlásához vezető okok

Az adatközpont leállásának leggyakoribb oka az áramszünet. Áramkimaradás bármikor előfordulhat. Ezért az adatközpontokat tartalék áramforrással tervezték arra az esetre, ha a fő áramellátás megszakadna. Akkumulátorokat vagy generátorrendszereket gyakran használnak tartalék áramforrásként. A probléma az, hogy előfordulhat, hogy az akkumulátort nem cserélik ki időben, a generátort nem vizsgálják és karbantartják, ami problémákhoz vezet áramkimaradás esetén. Mindez azt jelenti, hogy a biztonsági mentési képességei nem állnak rendelkezésre, amikor a legnagyobb szüksége lenne rájuk.

Áramkimaradás esetén az UPS-rendszerek akkumulátorokat használnak tartalék áramforrásként, így ezek az adatközpontok üzemidejének fenntartásának elengedhetetlen részei. Az akkumulátor azonban nem mindig működik megfelelően. Az akkumulátor állapotának ellenőrzéséhez végezze el a gyártó által javasolt karbantartást. Legalább negyedévente ellenőrizni kell az akkumulátorokat a megfelelő beszerelés, kisütés és töltés szempontjából. Ez magában foglalja a szemrevételezést, a kapacitásellenőrzést, valamint a szoftveren vagy magán az UPS szállítóján keresztül végzett rendszeres felügyeletet.

Ezenkívül a magas hőmérséklet lerövidítheti a rendszer akkumulátorának élettartamát. Egy külön UPS-szoba építése csökkentheti az akkumulátor élettartamának kopását. Kerülje az akkumulátor gyakori lemerülését, és ügyeljen a laza csatlakozásokra vagy a kopott csatlakozókra. Röviden, az UPS egy különösen fontos rendszer, ésszerű tervezést, megfelelő használatot és szigorú karbantartást igényel.

Hibás működés a hűtőrendszerben

Az adatközpont összeomlásához vezető okok

Az adatközpontok mechanikus rendszerei sok áramot fogyasztanak, ami azt jelenti, hogy működés közben nagy mennyiségű hőt bocsátanak ki. Egy adatközpont egy percnyi működés után krematóriummá válhat. Ezért olyan fontos a hűtőrendszer. És még akkor is, ha hőmérséklet-érzékelők olvasnak, és figyelmeztetéseket küldenek a rendszergazdáknak, biztosnak kell lennie abban, hogy elegendő ideje van a központ tartalék hűtési eljárásainak végrehajtására, mielőtt minden elolvadna.

Ezenkívül sok hűtőrendszert nem igazán úgy terveztek, hogy lépést tartson a megnövekedett hőszinttel egy modern, nagy kapacitású adatközpontban. Az olyan helyzetek feltérképezése, amikor az adatközpont 100%-os kapacitással működik, segíthet a jövőbeni jobb hűtési rendszerek tervezésében. A rendszer hőmérséklet-ingadozásaira figyelmeztető rendszereket is fel kell állítani. Használhat néhány hőmodellező szoftvert és néhány DCIM rendszert. Ezenkívül a kémiai hűtőközegek jobb választás, mint a vízbázisú rendszerek.

Az automatikus átalakítási folyamat nem működik megfelelően

Az adatközpont összeomlásához vezető okok

A legtöbb szolgáltató, szervezet és vállalkozás rendelkezik biztonsági adatközpontokkal, amelyeket éles adatközpontokhoz használnak. Áramkimaradás esetén az elsődleges adatközpontban a biztonsági mentési adatközpont automatikusan elindul, és minden forgalom erre a tartalék létesítményre irányul. Ha megfelelően történik, a folyamatnak zökkenőmentesnek kell lennie egészen a végfelhasználóig. Sajnos az automatikus feladatátvételek gyakran nem a várt módon működnek. A probléma szokásos oka a rendszeres tesztelés hiánya. Még a termelési infrastruktúra kis változtatásai is nagy hatással lehetnek az automatizált feladatátvételre. Ezért az infrastruktúra módosításakor az automatizált feladatátvételi eljárásokat tesztelni kell, hogy megbizonyosodjon arról, hogy semmi sem tért el a folyamattól.

Elavult hardver

Az adatközpont összeomlásához vezető okok

Az egyes rendszerek minden hardverének meghatározott élettartama van. És minél tovább használ egy hardvert, annál valószínűbb, hogy problémákba ütközik. Ezt mindenki tudja, de gyakran előfordul, hogy egy fontos alkalmazás összeomlik csak azért, mert 10 éves hardveren fut. Ezek a problémák gyakran az új hardver- vagy szoftverplatformokra vonatkozó átfogó csere- és frissítési tervek hiánya vagy a költségvetés hiánya miatt merülnek fel. Ha pénz kérdése, akkor nincs mit tenni. De ha egyszerűen megpróbálja kihasználni, ameddig csak lehetséges, bármikor előfordulhat egy probléma, és ha megtörténik, a probléma által okozott kár sokkal nagyobb lehet.

A tűzoltó rendszernek vízszivárgási problémája van

Az adatközpont összeomlásához vezető okok

A legtöbb modern adatközpont vízmentes tűzvédelmi rendszert használ, hogy ne károsítsa a berendezést, ha szándékosan vagy véletlenül aktiválják. De sok régebbi létesítmény még mindig hagyományos tűzvédelmi rendszert használ adatközpontjaiban. Sok vízszivárgás okozott jelentős üzemzavarokat.

A vészkikapcsolás véletlenül aktiválódik

Az adatközpont összeomlásához vezető okok

A legtöbb adatközpont magas szintű fizikai biztonsága nem egyszerűen elriasztja a tolvajokat. Azt is bevezették, hogy elkerüljék azokat az alkalmazottakat, akik nem értik az adatközpontok működését. Például egy alkalmazás adminisztrátora bemegy az adatközpontba, és véletlenül vészkikapcsolást (EPO) vált ki. Az EPO egy nagy piros gomb, amely a teljes rendszer áramellátásának lekapcsolásáért felelős. És nyilvánvaló, hogy azok számára, akik nem értenek vagy nem rendelkeznek szakértelemmel, az ilyen tévedés teljesen lehetséges.

Kibertámadás alatt, ddos

Az adatközpont összeomlásához vezető okok

Az évek során a kibertámadások az adatközpontok meghibásodásának egyik vezető okai lettek, a 2010-es mindössze 2%-ról 2016-ra 22%-ra. Üzemeltetők Az adatközpontoknak lépéseket kell tenniük a támadások kockázatának korai észlelésére és csökkentésére szolgáló rendszerek létrehozására.

Az adatközpontokat nehéz megvédeni egy nagyszabású DDoS-támadás ellen. A legtöbb internetszolgáltató bizonyos védelmet nyújt a hálózat 3. és 4. rétegében, de az Ön szolgáltatásainak további védelemre van szükségük a 7. rétegben, amely kifejezetten HTTP GET-en vagy hívásokon keresztül célozható meg. Az olyan enyhítő szolgáltatások, mint a tűzfalak, az IPS/IDS és a DDoS kombinálhatók a forgalom átirányításához.

Természeti katasztrófa

A közelmúltban megnövekedett viharok és áradások jelentős fennakadásokat okozhatnak az adatközpontokban. 2010-ben több mint 250 természeti katasztrófa történt az Egyesült Államokban. A statisztikák szerint az Egyesült Államok New Jersey állama 63,9 milliárd dolláros veszteséget szenvedett el a Sandy szupervihar okozta üzleti megszakítás miatt 2012-ben.

Lépések az adatközpont „összeomlása” okozta károk korlátozására

Ha gondosan megtervezik a rutin karbantartás leállását, és előre figyelmeztetik az ügyfeleket a központ leállásaira, különösen alacsony forgalom esetén, az ügyfelek együttérzőbbek lesznek, és a károk jelentősen csökkennek. A legnagyobb kár akkor következik be, ha váratlanul, és különösen akkor, ha sokáig tart, és további problémák merülnek fel. Tartsa stabilan a teljes vállalat erőforrásrendszerét, hogy az alkalmazottak hatékonyan végezhessék munkájukat, csökkentve ezzel az IT-részlegek terheit.

Kimondottan:

  • Készítsen biztonsági másolatot az adatokról: Ha adatközponti leállással szembesül, adatainak (és ami még fontosabb, ügyfelei adatainak) készen kell állniuk az induláskor. Kezdje el a hibaelhárítást, és futtassa újra. A rendszeres biztonsági mentések csökkentik a valódi összeomlás kockázatát. Ha cége megengedheti magának, bizonyos termékek, például az EMC VPLEX termékcsaládja vagy a VEEAM biztonsági mentési és replikációs szoftvere segíthet minimalizálni az állásidőt azáltal, hogy automatikusan átvált egy helyre.
  • A szerverrendszer rendszeres felügyelete: A megfigyelés egy olyan szolgáltatás, amelyet rendszeresen végezhet, és általában nem kerül túl sokba. Egy harmadik féltől származó megfigyelő szolgáltatás értesíti Önt a lehetséges szerverleállásról, így Ön azonnal megoldhatja a problémát.
  • Minimalizálja az emberi hibákat: Legyen körültekintő, amikor szerverrendszereken vagy elektromos vezetékeken dolgozik vagy járkál, nehogy véletlenül megsérüljenek, vagy egyszerűen ne érintsen meg rejtélyes kapcsolókat szakértelme nélkül. Tartsa távol a folyadékokat a mechanikus rendszerektől. Hívjon adatvédelmi szakértőt bármikor, amikor a szerveren frissítésre vagy karbantartásra van szüksége, és tartsa be a központ szabályait.

Minden adatközpontnak, a kis központoktól a nagyvállalati méretű létesítményekig és szolgáltatókig, 100%-ban arra kell törekednie, hogy megbízható szolgáltatásokat nyújtson a felhasználóknak. Ha időt szán a jövő megtervezésére, a karbantartás és az emberi tényezők elveit követve, adatközpontja elkerülheti a meghibásodások leggyakoribb okait.

többet látni


Állítsa be a Linksys útválasztót statikus IP-címmel

Állítsa be a Linksys útválasztót statikus IP-címmel

A statikus IP-cím a számítógép vagy az útválasztó beállításaiban konfigurált rögzített IP-cím. Egyes internetszolgáltatók (ISP) megkövetelik, hogy statikus IP-címet adjon meg a számítógépén vagy az útválasztó TCP/IP-beállításaiban, hogy csatlakozhasson az internethez.

Hogyan lehet eltávolítani a PublicBoardSearch böngésző-gépeltérítőt

Hogyan lehet eltávolítani a PublicBoardSearch böngésző-gépeltérítőt

A fertőzés módja szerint a PublicBoardSearch a böngésző-gépeltérítő kategóriába tartozik. Ez egy olyan típusú rosszindulatú program, amelyet arra terveztek, hogy átvegye egy ismerős böngésző beállításait.

Nagy felbontású Apex Legends háttérképek gyűjteménye számítógépekhez

Nagy felbontású Apex Legends háttérképek gyűjteménye számítógépekhez

Nagy felbontású háttérképek gyűjteménye számítógép- és laptopfelhasználók számára teljes felbontásban Full HD-tól 4K-ig.

Mi az a Localhost? Miben különbözik a Localhost a 127.0.0.1-től?

Mi az a Localhost? Miben különbözik a Localhost a 127.0.0.1-től?

A Unix rendszer, más néven „visszacsatolás”, képes hálózati kommunikációt küldeni és fogadni magának egy virtuális hálózati eszközön keresztül. A számítógép képes üzeneteket küldeni magának, lehetővé téve a kommunikációt aktív hálózat nélkül.

5 ok, amiért érdemes ingyenes víruskereső szoftvert használni

5 ok, amiért érdemes ingyenes víruskereső szoftvert használni

Biztosan hallottad már azt a mondást, hogy azt kapod, amiért fizetsz, de mi a helyzet a víruskereső szoftverrel? Vásároljon szoftvercsomagokat az ingyenes védelmi megoldások helyett? Talán nem ez a helyzet, és itt van az ok!

Mi a különbség a Windows és a Mac víruskereső szoftverei között?

Mi a különbség a Windows és a Mac víruskereső szoftverei között?

A mai cikkben a Quantrimang összefoglalja a piacon lévő népszerű víruskereső szoftvermárkákat, és megnézi, miben különböznek a Windows PC-k és a macOS között.

4 dolog, amit a felhasználók látni szeretnének a Windows rendszerben 2021-ben

4 dolog, amit a felhasználók látni szeretnének a Windows rendszerben 2021-ben

Nem világos, hogy a Sun Valley mit hoz a legfelső szintű felhasználói felület változtatásokon és fejlesztéseken túl. Tehát íme, amit a felhasználók látni fognak a Windows 10 nagy Sun Valley frissítésétől, amikor az jövőre indul.

A Futtatás rendszergazdaként nem működő hiba javítása a Windows rendszerben

A Futtatás rendszergazdaként nem működő hiba javítása a Windows rendszerben

A Windows a Futtatás rendszergazdaként lehetőséget biztosít, amely lehetővé teszi a felhasználók számára, hogy rendszergazdai jogosultságokkal futtassák az alkalmazásokat és programokat. Használhatja számítógépe hibaelhárítására is. De mi van, ha ez a funkció hibásan működik, és elveszi a rendszergazdai jogokat?

A Lemezhibák javítása Windows rendszeren

A Lemezhibák javítása Windows rendszeren

A számítógép meghajtójával kapcsolatos hibák megakadályozhatják a rendszer megfelelő indítását, és korlátozhatják a hozzáférést a fájlokhoz és az alkalmazásokhoz.

Moduláris kártevő – Új lopakodó támadási módszer az adatok ellopására

Moduláris kártevő – Új lopakodó támadási módszer az adatok ellopására

Egyes rosszindulatú programváltozatok különböző modulokat használhatnak a célrendszerre gyakorolt ​​hatásuk megváltoztatására. Tehát mi az a moduláris kártevő, és hogyan működik?