Khái niệm RPO?
RPO là viết tắt của cụm từ Recovery Point Object, có nghĩa là thời điểm phục hồi dữ liệu.
Đây là một thời điểm rất cụ thể, ví dụ như 1 phút trước, 1 ngày trước, tuần trước hay tháng trước. Đại khái đây là thời điểm đã xảy ra và các doanh nghiệp muốn khôi phục dữ liệu về đúng thời điểm ấy.
Ví dụ như: Công ty A muốn hệ thống backup của họ có khả năng phục hồi dữ liệu 1 ngày trước từ thời điểm cần phục hồi dữ liệu thì RPO là 1 ngày. Hay một công ty khác muốn có thể khôi phục lại dữ liệu ở bất kỳ thời điểm nào thì RPO của họ là zero.
Khái niệm RTO?
RTO được định nghĩa là Recovery Time Object, có nghĩa là thời gian phục hồi được tính từ thời điểm của chủ doanh nghiệp đưa ra yêu cầu để restore lại theo RPO đã chỉ định.
Ví dụ như một phòng nhân sự mất đi file tính lương và đưa ra yêu cầu phải hoàn thành việc phục hồi trong vòng 1 tiếng thì RTO lúc này sẽ là 1 giờ.
Tương tự như RPO thì thời gian này sẽ đóng vai trò tỉ lệ nghịch với chi phí, nghĩa là RTO càng nhỏ, chi phí càng lớn.
Vấn đề khi triển khai Backup
Rõ ràng bạn đã thấy vấn đề, RTO càng ngắn thì ảnh hưởng đến doanh nghiệp càng nhỏ, RTO càng cao thì doanh nghiệp thất thu càng lớn (đối với những hệ thống đặc biệt quan trọng). Thông thường RTO và RPO là cặp đôi đồng hành, thường RPO ngắn thì đòi hỏi RTO cũng ngắn.
Trong RTO vai trò năng lực của đội ngũ thực hiện công tác phục hồi hệ thống là cực kỳ quan trọng, đối với RPO bạn có thể set lịch để task backup tự động chạy, và công việc chính chỉ là monitoring thì RTO đòi hỏi bạn phải bắt tay vào restore, và việc này hết sức cẩn trọng và tỉ mỉ.
RTO càng nhỏ đòi hỏi hệ thống backup của bạn phải hoạt động real time, nghĩa là bên cạnh hệ thống production bạn đang xài thì phải có 1 hệ thống backup chạy song song. Chung quy là RTO = 0 tương ứng với việc chi phí và nhân lực đầu tư để vận hành và duy trì hệ thống backup sẽ rất đắt đỏ.
Đối với 1 số doanh nghiệp đòi hỏi RTO = 0, điển hình là các ngân hàng, các công ty cung cấp service IT cho khách hàng với cam kết on time 24/24 kể cả động đất sóng thần. Với các doanh nghiệp loại này, thay vì họ chỉ tốn 1 triệu $ đầu tư cho hệ thống production chạy thì giờ họ sẽ tốn thêm 2, 3 triệu $ thậm chí nhiều hơn để đầu tư những site tương tự ở vị trí khác nhau và hệ thống backup chạy real time cùng production vận hành liên tục.
Đối với nhiều công ty lớn ví dụ như google, microsoft, amazon, thì RTO của họ là zero, và họ có những hệ thống backup của backup của backup, có nghĩa là nhiều lần backup, cùng 1 lúc ra lệnh thực thi ghi chép 1 file dữ liệu có thể được ghi và lưu trữ ở nhiều nơi khác nhau trên thế giới và việc backup cho các loại dữ liệu nầy hầu như real time. Nên bất kỳ thời điểm nào chúng ta cần phục hồi lại.
Giải pháp từ góc nhìn khách quan
Với những hệ thống đòi hỏi RPO tính bằng 1 vài phút đến 1 vài giây thông thường người ta hay sử dụng những hệ thống Synchronous Replication (Nhân rộng đồng bộ) dữ liệu được đặt ở nhiều site khác nhau và đồng bộ liên tục.
Với RPO được tính bằng 1 vài giờ đến 1 ngày thông thường người ta sử dụng Asynchronous Replication. Dữ liệu được đặt ở nhiều site khác nhau và thời gian đồng bộ được tính bằng giờ, ngày.
Đối với những hệ thống yêu cầu RPO không quá rush (được tính bằng vài ngày cho đến 1 tuần) thì việc lưu trữ backup trên tape thường được sử dụng nhiều, thông thường sau khi hoàn thành task backup dữ liệu được lưu vào tape và đặt ở 1 nơi khác cách xa công ty (thường là đặt trong các safe box tại ngân hàng).
Việc đòi hỏi thời gian up-time 24/24 kể cả lúc sự cố xảy ra (RTO=0) đòi hỏi bạn phải trang bị hệ thống HA ở nhiều site khác nhau, đối với việc HA thời gian down time hầu như là zero.
Khi sự cố xảy ra, việc phục hồi nguyên hệ thống được tính bằng nhiều giờ đến nhiều ngày thông thường hay dùng hot site.
Hot site là 1 nơi đặt cách xa công ty và có trang bị đầy đủ các hạ tầng tối thiểu để vận hành 1 hệ thống mà site chính đang có, bao gồm từ hạ tầng về công nghệ thông tin và nơi làm việc cho nhân viên và dĩ nhiên dữ liệu định kỳ vẫn được đồng bộ lên hot site.