Continuitatea IT pe intelesul tuturor

Timpii morți nu sunt o opțiune pentru organizațiile moderne care trebuie să îndeplinească nevoile și așteptările clienților lor. Pot apărea diferite tipuri de incidente și vă pot afecta veniturile sau chiar existența afacerii. Fie că este vorba de un atac de tip ransomware, de o întrerupere a energiei electrice, de inundații sau pur și simplu de greșeli umane, aceste evenimente sunt imprevizibile și cel mai bun lucru pe care îl puteți face este să FIȚI PREGATITI.

Pregătirea înseamnă că ar trebui să aveți un plan solid de continuitate a activității și de recuperare în caz de dezastru (plan BCDR). Unul care a fost testat și care poate fi pus în mișcare fără probleme.

Doi dintre parametrii importanți care definesc un plan BCDR sunt obiectivul punctului de recuperare (RPO) și obiectivul timpului de recuperare (RTO). Pentru cei dintre voi care nu sunt familiarizați cu acești termeni, permiteți-mi să vă fac o scurtă descriere:

  • RPO – Obiectivele punctului de recuperare se referă la toleranța la pierderi a companiei dvs.: cantitatea de date care poate fi pierdută înainte de apariția unui prejudiciu semnificativ pentru companie. Obiectivul este exprimat ca o măsurare a timpului de la evenimentul de pierdere la cea mai recentă copie de rezervă precedentă.
  • RTO se referă la cât timp poate fi oprită o aplicație fără a provoca daune semnificative companiei. Unele aplicații pot fi întrerupte zile întregi fără consecințe semnificative. Unele aplicații cu prioritate ridicată pot fi oprite doar câteva secunde, fără a provoca iritarea angajaților, furia clienților și pierderea afacerii.

În timp ce RPO și RTO pot părea similare, ele au scopuri diferite și, într-o lume ideală, valorile lor ar fi cât mai aproape de zero. Cu toate acestea, înapoi în lumea noastră, costul pentru zero RPO și RTO ar fi extrem de scump și s-ar putea să nu merite efortul.

Să analizăm mai îndeaproape obiectivele de recuperare. RPO se referă la cât de multe date vă permiteți să pierdeți înainte ca acestea să afecteze operațiunile comerciale. De exemplu, pentru un sistem bancar, o oră de pierdere a datelor poate fi catastrofală, deoarece operează tranzacții live. La nivel personal, te poți gândi și la RPO ca în momentul în care ai salvat un document la care lucrezi pentru ultima dată. În cazul în care sistemul dvs. se blochează și progresul dvs. se pierde, cât din munca dvs. sunteți dispus să pierdeți înainte ca acesta să vă afecteze?

Pe de altă parte, RTO este intervalul de timp în care aplicația și sistemele trebuie restaurate după o întrerupere. Este o practică bună să măsoare RTO începând cu momentul în care are loc întreruperea, în loc de momentul în care echipa IT începe să rezolve problema. Aceasta este o abordare mai realistă, deoarece reprezintă punctul exact în care utilizatorii încep să fie afectați.

Cum să definiți valorile RTO și RPO pentru aplicațiile dvs.

Adevărul este că nu există o soluție unică pentru un plan de continuitate a afacerii și valorile sale. Companiile sunt diferite de la o verticală la alta, au nevoi diferite și, prin urmare, au cerințe diferite pentru obiectivele lor de recuperare. Cu toate acestea, o practică obișnuită este împărțirea aplicațiilor și serviciilor în niveluri diferite și stabilirea valorilor timpului de recuperare și a obiectivelor punctuale (RTPO) în conformitate cu acordurile la nivel de serviciu (SLA) la care s-a angajat organizația.

Clasificarea protecției datelor este importantă pentru a determina modul de stocare, acces, protejare, recuperare și actualizare a datelor și informațiilor mai eficiente pe baza criteriilor lor specifice. Este esențial să vă analizați aplicațiile și să determinați care dintre acestea vă conduc afacerea, generând venituri și sunt imperative să rămâneți operațional. Acest proces esențial pentru un bun plan de continuitate a activității se numește analiza impactului afacerii (BIA) și stabilește protocoale și acțiuni pentru a face față unui dezastru.

De exemplu, puteți utiliza un model pe trei niveluri pentru a vă proiecta planul de continuitate a afacerii:

  • Nivelul 1: aplicații critice pentru misiune care necesită un RTPO de mai puțin de 15 minute
  • Nivelul 2: aplicații critice pentru afaceri care necesită RTO de 2 ore și RPO de 4 ore
  • Nivelul 3: Aplicații non-critice care necesită RTO de 4 ore și RPO de 24 de ore

Este important să rețineți că aplicațiile critice pentru misiune, critice pentru afaceri și non-critice variază în funcție de industrii și fiecare organizație definește aceste niveluri pe baza operațiunilor și cerințelor lor.

Cum funcționează RTO și RPO în practică

Recuperarea articolelor granulare: un avocat al companiei șterge din greșeală un e-mail sensibil la timp, apoi golește conținutul folderului Coș de gunoi. Deoarece Microsoft Exchange este o aplicație critică pentru afaceri pentru această companie ocupată, IT face backup continuu al modificărilor la nivel delta din Exchange. Și întrucât aplicația lor de backup este capabilă de backup și recuperare granulară, ei pot recupera mesajul individual într-un RTO de 5 minute în loc să restaureze o întreagă mașină virtuală pentru un singur mesaj.

Site de comerț electronic: site-ul de e-commerce auto-găzduit al unui magazin cu amănuntul utilizează trei baze de date diferite: o bază de date relațională care stochează catalogul de produse, o bază de date de documente care raportează datele istorice ale comenzilor și o bază de date API care se conectează la gateway-ul procesorului de plăți. Baza de date a documentelor poate reconstrui date din alte baze de date, astfel încât RTO și RPO să fie în termen de 24 de ore. Compania adaugă produse la baza de date relațională doar o dată pe săptămână, astfel încât RPO nu este critic. RTO este: dacă baza de date cade, atunci tranzacțiile clienților se opresc.

Pentru a-l menține extrem de disponibil, compania a investit într-un serviciu de failover, astfel încât baza de date se întinde imediat pe serverele virtuale. Compania replică cele câteva modificări pe care le face în cursul săptămânii pe platforma DR a furnizorului lor. Baza de date API conține informații de comandă și are nevoie de RPO și RTO în câteva secunde. IT replică în mod continuu date pe site-ul de failover, care preluează imediat prelucrarea în cazul în care baza de date API cade.

Concluzie

Nimeni nu poate prezice un dezastru, cu toate acestea, puteți acționa organizat urmând planul dvs. de continuitate a afacerii atunci când vă confruntați cu un astfel de incident. Valorile RPO și RTO pot varia în funcție de companii, dar vor fi în orice moment un compromis între nevoile de afaceri pentru disponibilitate și investițiile necesare în IT. Estimarea lor ar trebui să fie rezultatul unei deliberări între afacerea organizației dvs. și experții IT. Dar ceea ce depășește orice deliberare este implementarea unei soluții de disponibilitate fiabile pentru sarcini de lucru virtuale, fizice și cloud, pentru a asigura operațiuni Always-On pentru afacerea dvs.

Sursa: https://www.veeam.com/blog/rto-rpo-definitions-values-common-practice.html

Sursa: https://www.enterprisestorageforum.com/storage-management/rpo-and-rto-understanding-the-differences.html

Comments are closed.

Translate »