fbpx
Ondřej Flídr

Skoro každý, kdo provozuje nějaký ten online projekt, už to asi zažil: dorazí SMS nebo automatický hovor z monitoringu, že něco nefunguje. Vašemu milovanému projektu je ouvej a žádá si vaši pozornost. 

Nemusí to být ani katastrofa typu požár datacentra, nebo zemětřesení – vyřadit systémy zvládne i prasklé potrubí v budově, administrátorská chyba na síti v Indii nebo neodborný zásah uživatele. Pamětníci si jistě vzpomenou na rok 2007 a kauzu s heslem NBUSR123

Ve vshosting~ děláme všechno pro to, abychom podobným situacím zabránili – víc se o tom dočtete v článku o našem nekompromisním zabezpečení. Přesto, ne všechny rizikové faktory a skutečnosti jsou v naší moci a vznik nenadálých situací tak nelze vyloučit. Scénář je pak vždy stejný. Najednou, bez jakéhokoliv varování, všechno zhasne a monitoring se rozsvítí rudě. Nic nefunguje. A co teď? 

Můžete si stěžovat, nadávat, panikař… nebo aktivovat svoje disaster recovery plány. Scénáře, které jste sepsali v době klidu pro případ, že se něco hodně, ale hodně pokazí. Dokumenty, o kterých jste doufali, že je nikdy nebudete muset číst.

Co jsou disaster recovery plány a jak mají vypadat

Disaster recovery plány jsou dokumenty, které jasně popisují, jak dostat váš projekt zpět do funkčního stavu. Mají mnoho podob a pokrývají spoustu možných scénářů. Mohou to být jednoduché seznamy krizových přístupů ale i komplexní postupy, které zahrnují úkony napříč několika odděleními ve firmě. 

Vždy by měly obsahovat: 
– co je potřeba udělat
– kdo to má udělat
– jak to má udělat
– kde jsou dostupné zálohy
– v jakém pořadí nahazovat služby
– kdy obnovovat která data

Vhodné je zahrnout i přihlašovací údaje na krizové účty, ať je máte po ruce. Cílem disaster recovery plánů je vždy minimalizovat obchodní dopad katastrofy a co nejrychleji postavit projekt zpátky na nohy. Musí být napsány jasně a stručně. Protože když už podle nich budete postupovat, určitě to nebude v klidu a v pohodě.

Je běžné, že disaster recovery plány nejsou čistě IT charakteru a mají přesah do dalších oddělení ve firmě. Kromě technického zvládnutí problému totiž potřebujete i udržovat kontakt se zákazníky, případně zajistit podklady pro právní oddělení. Proto je potřeba při sepisování disaster recovery plánů přibrat na pomoc zástupce jiných oddělení a konzultovat jednotlivé kroky s nimi. Musíte mít jistotu, že postupy dávají všem smysl a nezapomněli jste na nějaký netechnický dopad.

Při jejich tvorbě můžeme vycházet z principu letectví. Pokud dojde v letadle k problému, platí postup „Aviate, Navigate, Communicate“, tedy udržet letadlo ve vzduchu, zjistit, kde jste a kam se můžete vydat a až pak se zabývat komunikací. 

V IT toto lze využít obdobně. Nejprve se snažte zachránit, co jde (tj. minimalizovat přímé dopady, klidně odstavením systémů). Dostaňte systém do dostatečně stabilní podoby, a až pak zajistěte komunikaci ven. Pokud máte k dispozici více administrátorů, lze proces paralelizovat, a je to i vhodné. Umíte si představit horší situaci, než když admina otravují s dotazy jeho kolegové z obchodu a customer supportu a ptají se, co mají říci klientům?

Krok 1: Udržte projekt „nad vodou“

Když letadlo spadne na zem, je konec. Přišli jste o letadlo, posádku, náklad i pasažéry. Proto je potřeba ho za každou cenu udržet ve vzduchu. 

V IT to funguje podobně. Pokud přijdete o jednu službu, je potřeba minimalizovat dopady na ty další. Zabránit kaskádovému efektu. Nemůžete si dovolit přijít o všechno. A to i za cenu odstávky. Když přijdete o všechna data i systémy, je to pro firmu naprosté existenční riziko. Krátkodobá odstávka projektu je výrazně menší zlo než dlouhodobá obnova dat. 

Typickým příkladem toho je chyba v aplikaci, která při updatu ukládá poškozená data. V tomto případě je mnohem lepší aplikaci odstavit a zabránit zničení většího množství dat, než ji nechat běžet a pracovat na vydání opravy.

Krok 2: Zorientujte se

Výborně, v prvním kroku jste úspěšně zabránili zničení všech dat. Nicméně stále vzniká škoda, aplikace je nedostupná, klienti začínají být naštvaní. To je správná chvíle začít zjišťovat, co se stalo, jaké jsou celkové dopady a připravit plán na obnovu. 

Lze opravit aplikaci jednoduchým fixem? Je potřeba obnovit nějaká data ze zálohy? Jak dlouho bude trvat návrat do minimálního funkčního stavu? A jak dlouho bude trvat kompletní oprava? O kolik dat jste nenávratně přišli? To jsou všechno otázky, které jsou teď na stole, a na které potřebujete rychle znát odpověď.

Krok 3: Komunikujte se zákazníky

V této fázi už víte co se stalo, co musíte udělat i jaké jsou dopady na vaši společnost. Dokonce i jak dlouho bude trvat oprava. V tuto chvíli můžete komunikovat zákazníkům odhad časové náročnosti.

Doporučujeme vyčlenit jednoho pracovníka jako styčný bod pro komunikaci. Někoho, kdo bude od začátku mluvit s obchodem, podporou a se zákazníky. Zároveň bude sloužit jako štít stojící před adminy, kteří zachraňují situaci. Tuto roli se hodí přidělit někomu z řízení projektu, v agile světě by to byl project owner. A důležité je také zajistit, aby všichni ve firmě věděli, na koho se mají obracet s dotazy.

Komunikace ven je bezesporu důležitá, a v krizi o to víc. Avšak, neměla by být na úkor obnovy provozu. Hlavně pro obchod a podporu vždy platí, že informace, které jim předáváme, musí být aktuální a platné v daném časovém bodě. Nemusí být ale 100% přesné a neměnné. Vždy stavíme na tom, co v daném bodě víme. 

Na začátku se situace může zdát snadno opravitelná, ale další průzkum může odhalit mnohem dramatičtější dopady. Anebo naopak. Proto doporučujeme nikdy nekomunikovat termíny a odhady jako definitivní. Pokaždé je potřeba říct „ale situace se může změnit“, vždy je potřeba pro jistotu počítat s výrazným prodloužením obnovy. S tím musí počítat všichni lidi ve firmě.

Pravomoce krizového řízení

V klidných dobách je pochopitelné, že velké investice nebo zásahy do infrastruktury je nutné konzultovat s vedením firmy a důkladně je naplánovat. Můžete déle vybírat nejvýhodnějšího dodavatele, dohodnout s ním dobré obchodní podmínky, zanalyzovat a otestovat dopady řešení. Jakmile ale udeří krize, rozvážnost jde z velké části stranou. 

Záchranný tým potřebuje mít pravomoce činit rozhodnutí rychle a neřešit zcela optimální efektivitu či úspornost. Pokud vám „umře“ nějaký klíčový hardware a nemáte skladem náhradní kus, není prostor na vyjednávání s dodavateli. Je potřeba vzít firemní kartu, sednout do auta a vyrazit do nejbližšího obchodu, který má nový kus skladem. A to i za cenu vyšších nákladů. Je snad dlouhá odstávka vašeho projektu levnější? 

Pokud fungujete v cloudu, záchranný tým musí mít pravomoc ihned spustit další instance – bez ohledu na rozpočet infrastruktury. Případně si dopředu stanovte hranice rozpočtu, přes které nelze jít, ale zvažte přitom náklady na každou minutu, kdy váš projekt nefunguje.

Zálohy, zálohy, zálohy

Zálohy a jejich obnova jsou nedílnou součástí každých disaster recovery plánů. A to nejen zálohy mít, ale jejich funkčnost pravidelně testovat a nastavit optimální zálohovací frekvenci. Bez ohledu na to, jestli máte infrastrukturu v cloud nebo ne.

I v cloudu je třeba zálohovat!

Často se setkáváme s názorem, že infrastrukturu a data v cloudu není třeba zálohovat. Slýcháváme, že: „proto si přece platíme cloud, abychom nemuseli utrácet za zálohy“. Tento přístup je chybný a u jeho zastánců může vést až ke krachu firmy.

V cloudu si pořizujete výpočetní kapacitu, prostor na storage a služby s ním spojené, ale nekupujete si bezpečnost vašich dat. Kupujete si pouze jistotu, že v případě problémů můžete data do cloudu obnovit a spustit novou sadu serverů. Je ale vaše zodpovědnost mít kopii dat k obnově, mít informace o konfiguraci serverů a mít popsaný postup nasazení aplikace. 

Cloud vám poskytuje platformu, ale obchodní hodnotu jí dáváte vy. Cloud je vám v tom schopen pomoci georeplikací, nebo službou na zálohování. Zájem o její využití musíte mít vy, včetně toho dát jí smysl a mít připravený proces obnovy dat.

Testování kvality záloh a optimální backup frekvence

Potřebujete mít také jistotu, že zálohy jste schopni obnovit. Až příliš často se stává, že firma sice krásně zálohovala, ale když došlo na potřebu obnovy, zálohy byly nepoužitelné. A nemusí to být jenom chyba v záloze jako takové. Zálohy mohou být z důvodu problému nedostupné nebo nekompletní. A proto je třeba je pravidelně testovat. Vyzkoušet si, že jste schopni si data ze záloh obnovit, stejně tak, že zálohujete vše, co potřebujete – a v dostatečném množství. 

Nikdy nebudete mít v záloze 100 % dat, vždy o něco přijdete. Zůstává otázkou, jestli můžete ztratit data za týden, za den nebo za hodinu. O kolik dat jste ochotni přijít? Respektive, kolik peněz je vaše firma ochotná do zálohování a obnovy dat investovat? Zde platí nelineární vztah – pokud zálohování 1x denně stojí XY kč, zálohování 2x denně nestojí 2 XY kč, ale klidně 5 XY, nebo 10 XY. Je třeba si říct, jestli mají data mimo zálohu takovou hodnotu, nebo jestli je výhodnější tato data již obětovat.

Co si z toho odnést

Nic není 100% a chyby se stávají. Každý admin už podobnou situaci zažil a nikdy to není příjemné. Přesto se vždy dá na situaci připravit předem a minimalizovat její dopady na chod firmy. 

Není to zadarmo a není to snadné. A v klidných časech to může vypadat, že vám to nic nepřináší, ale zabrání to velkým problémům v budoucnu. A vždy se to vyplatí. Myslete na to.

Chcete se poradit o optimálním režimu zálohování pro váš projekt? Obraťte se na naše experty: konzultace@vshosting.cz. Zdarma vám připraví řešení na míru.


vshosting~

Špičkový poskytovatel full-service řešení pro ty nejznámější hráče v e-commerce, 17 let zkušeností a ty nejmodernější technologie: to všechno je Shopsys. Svým klientům vyvíjí e-shopy a B2B systémy na míru na vlastní open-source platformě. Mezi jejich zákazníky patří známá jména jako například SCONTO Nábytek, Mountfield, Bushman nebo Office Depot. Proto je pro Shopsys klíčová maximálně spolehlivá a výkonná serverová infrastruktura, kterou jim zajišťujeme už od roku 2013.

Infrastruktura začíná narážet na výkonnostní limity

Na podzim 2020 jsme na straně vshosting~ pozorovali, že dosavadní platformní služba pro hostování projektů běžících na Shopsys framework už nemá dostatečně velkou výkonnostní rezervu. Díky růstu Shopsys projektů, blížící se předvánoční sezoně i očekávání přidání nových klientů jako například Mountfield, jsme společně vyhodnotili, že by řešení zasloužilo pořádný upgrade. 

Celá architektura Kubernetes clusteru, který u nás Shopsys měl, byla odladěná. Proto se nabízel upgrade hardwaru na výkonnější variantu. Nešli jsme do ničeho menšího než extrémně výkonných serverů od AMD s procesory EPYC – každý s 32 jádry a 64 vlákny. Dalším vylepšením byl přechod na rychlejší NVMe disky.

„Enterprise servery s procesory AMD EPYC ve vshosting~ nasazujeme kvůli bezkonkurenčnímu výkonu čím dál hojněji. Při upgradu infrastruktury Shopsysu šlo o jasnou volbu – zajistí pevné zázemí s výkonnostní rezervou pro rozšiřování služeb i marketingové akce. Ve spojení s PCI-e NVMe SSD disky, které nahradily SATA SSD, jde z pohledu hardware o to nejlepší, co můžeme klientům nabídnout.“

Tomáš Jeníkovský
Deputy Head of HW/DC vshosting~

Upgrade vedl ke zrychlení načítání webů až o 63 %

Celá realizace proběhla 20. listopadu 2020 pro databázové servery a 25. listopadu pro aplikační. A výsledek? Průměrné zrychlení projektů od Shopsysu o 55 %. U některých z nich i přes 60 %!

Krásným příkladem takového projektu je Tropic Fishing, jehož načítání bylo už před upgradem velice rychlé. V průměru 586 milisekund. A to se podařilo zrychlit na neuvěřitelných 357 milisekund, což představuje vylepšení o 39 %.


Z dalších projektů na Shopsysu pár příkladů za všechny: u prodejce outdoorového oblečení Bushman se díky upgradu hardware zrychlilo načítání webu o 56 %, u Papírnictví Pavlík o 62 % a u elektro obchodu EMOS dokonce o 63 %!

Lepší SEO i vyšší dostupnost 

SEO experti často mluví o tom, jak rychlost načítání zlepšuje ranking webu u Googlu a spol. Evidentně na tom něco bude: boost výkonu serverové infrastruktury se projevil nárůstem návštěvnosti z vyhledávačů o 16 %. Zvedla se i míra prokliků na web z výsledků vyhledávání, a to o celých 5 procentních bodů! 

Do budoucna očekáváme ještě větší pozitivní dopad na SEO projektů na Shopsys platformě. Svět optimalizace pro vyhledávače má totiž velkou setrvačnost. Na to se jako sněhová koule nabalí nižší bounce rate, více navštívených stránek a ve výsledku i to, co e-commerce projekty zajímá nejvíc: vyšší prodeje. To vše pouze díky modernizaci hardwaru, která díky těmto výsledkům může mít u velkých projektů návratnost i v rámci jednotek dnů.

Zároveň jsme ve vshosting~ vytvořili repliky pro Postgres a Elasticsearch Shopsysu. Ten tyto repliky plánuje využít pro zlepšení dostupnosti služeb, což pro zákazníky bude znamenat, že v případě přetížení, údržby nebo dokonce výpadku databáze se automaticky použije záloha a vše pojede dál. 

Jak o naší spolupráci mluví v Shopsysu?


„Dlouhodobá spolupráce s vshosting~ nás naučila, že jsou našimi spolehlivými partnery, ať už rosteme jakkoliv rychle. Díky jejich včasnému varování a  bleskovému upgradu infrastruktury jsme předešli potenciálním problémům, ale hlavně našim e-commerce projektům pomáháme více prodávat.“

Václav Macíček
Projektový ředitel Shopsys

Co jsme se naučili?

1. Proaktivita je u hostingu klíčová – proto serverovou infrastrukturu všech klientů důsledně monitorujeme. Například docházející výkon řešíme ještě než může způsobit problémy.

2. Vyšší výkon serverů v případě Shopysu => rychlejší načítání stránek – u Shopsys projektů čas načítání webů klesl v průměru o 55 %.

3. Investice do hardwaru může mít bleskovou návratnost – některým e-commerce projektům zrychlí web klidně i o polovinu. Výrazně tak zlepší SEO a pomůže s prodeji.

Zajímá vás, jak pomůžeme i vašemu e-shopu? Napište nám na obchod@vshosting.cz. A do druhého pracovního dne se vám ozveme.


Během 17 let jsme provedli úspěšnou migrací stovky klientů. Pomůžeme i vám.

  1. Domluvte se na konzultaci

    Stačí nám zanechat kontakt. Obratem se vám ozveme.

  2. Bezplatný návrh řešení

    Nezávazně probereme, jak vám můžeme pomoct. Navrhneme řešení na míru.

  3. Profesionální realizace

    Připravíme vám prostředí pro bezproblémovou migraci dle společného návrhu.

Zanechte nám svůj e-mail nebo telefon




    Nebo nás kontaktujte napřímo

    +420 246 035 835 V provozu 24/7
    konzultace@vshosting.cz
    Zkopírovat
    Obratem se vám ozveme