Što su RTO i RPO i kako ih izračunati?

Dogodila se katastrofa, poplava, zločudni virus, pojavio se dim iz servera... koji god razlog bio, posao stoji, podaci su nedostupni, nema računa, stanja skladišta, ponuda koje se rade nekoliko sati, projekt koji je tik pred rokom predaje...

Sreća, imate backup i čekate IT ekipu da vrati stvar u funkciju. 

Vrijeme prolazi, vraćate se s druge kave ali sustav još ne radi... pa koliko može to trajati? Samo treba vratiti podatke iz backupa!

Da, vratiti podatke iz backupa...

 

U prethodnom članku spomenuo sam RTO (Return Time Objective) i RPO (Recovery Point Objective), dva važna koncepta koji određuju koliko dugo može trajati oporavak i koliko je gubitaka podataka prihvatljivo.

Uobičajeno se kaže da je za kritične aplikacije RTO i RPO 15 minuta svaki. Je li moguće? Svakako. Je li realno? Ovisi o budgetu. Svaki korisnik je različit i nemaju svi jednaka očekivanja i jednaki budget pa će tako nekome 15 minuta biti super a nekome neće biti izvedivo.

Kako da izračunam RTO i RPO?

Prije svega razmislite koliko vremena možete tolerirati ispad sustava iz funkcije. I ovdje, nije isto za svakog korisnika, svaku aplikaciju i svaki servis.

Mi to mjerimo vrlo jednostavno - koliko vremena je potrebno korisniku da postane ljut ;-)

Recimo da je sa određenu aplikaciju može tolerirati 1 sat. Ok, sad znamo da RTO i RPO ne smiju biti veći od 1 sata. 

Dalje, koja su fizička ograničenja vezana uz podatke koje je potrebno vratiti i trenutno korištenu metodu backupa? Ukoliko se radi o velikoj bazi podataka i radi se datotečni (file) backup potrebno je izračunati vrijeme potrebno da se baza vrati iz backupa (RTO) te kada je izvršen posljednji uspješni backup (RPO).

Kad to zbrojimo i usporedimo s vremenom toleriranja - je li u granicama? Ukoliko vrijeme povrata i količina izgubljenih podataka prelazi vrijeme tolerancije, potrebno je izmjeniti način backupa i oporavka.

Ovaj proces se može izmjeriti za sve vrste podataka odn. katastrofa.


Iako, kad se dogodi katastrofa, jedini vremenski cilj s kojim se borimo je onaj u glavi korisnika. Upravo zato je bitno razgovarati s korisnikom i iz razgovora pokušat doznati koje je njegovo vrijeme tolerancije i po tome predložiti sustav za oporavak od katastrofe.

FixIT. Backup je rješenje koje je višestruko provjereno i odgovara potrebama većine tvrtki. 

  • Upravljano - kontinuirano praćenje izvršenosti backupa, rješavanje problema u slučaju da se backup ne odrađuje, testiranje povrata podataka
  • Kontinuirana i automatizirana pohrana podataka
  • Brza uspostava poslovanja