بازیابی فاجعه یا Disaster Recovery (DR) چیست؟ چه مزایا و تکنیک‌هایی دارد؟ -

برای هر سازمان یا کسب و کاری ممکن است یک بحران یا فاجعه اتفاق بیفتد که عملکرد آن ها را به شدت تحت تاثیر قرار دهد اما چیزی که یک سازمان یا کسب و کار را از شکست حتمی نجات می دهد داشتن یک برنامه دقیق، به‌روز و تست شده برای مواقع بروز بحران است. در این زمان مفهوم بازیابی پس از بحران یا فاجعه (Disaster Recovery یا DR) معنا پیدا می کند. Disaster Recovery مجموعه‌ای مستند و دقیق از رویه‌هایی است که برای به حداقل رساندن زمان مورد نیاز برای بازیابی عملکرد سازمان طراحی شده است.

نداشتن یک برنامه Disaster Recovery می‌تواند به‌طور جدی توانایی یک سازمان برای بازیابی داده‌های از دست‌رفته را مختل کند. این امر ممکن است منجر به خسارات مالی بسیار بیشتر و آسیب به اعتبار سازمان شود. حال برای اطمینان از اینکه سازمان شما بتواند در سریع‌ترین و آسان‌ترین حالت ممکن از بحران عبور کند، ابتدا باید بدانید Disaster Recovery چیست و چگونه باید آن را پیاده سازی کرد، در ادامه شما را با این مفهوم آشنا می کنیم.

Disaster Recovery چیست؟

بازیابی پس از بحران یا فاجعه (Disaster Recovery یا DR) روشی است برای مدیریت بحران که از طریق آن روند عادی کار پس از وقوع یک فاجعه از سر گرفته می‌شود. این امر معمولاً با از سرگیری فعالیت‌های حیاتی انجام می‌شود. به عبارت دیگر Disaster Recovery مجموعه‌ای مستند و دقیق از رویه‌هایی است که برای به حداقل رساندن زمان مورد نیاز برای بازیابی عملکرد سازمان طراحی شده است. این رویه‌ها مشخص می‌کند که سازمان برای بازیابی و بازگردانی سامانه‌ها، عملیات و داده‌های حیاتی خود پس از وقوع یک بحران، باید از چه مراحلی پیروی کنند. بخشی از اکثر طرح‌های بازیابی فاجعه شامل بازیابی دسترسی به داده‌ها، نرم‌افزارها، سخت‌افزارها، تجهیزات شبکه، اتصالات و برق است.

منظور از فاجعه در امنیت سایبری چیست؟

در برخی شرایط، امکاناتی که برای سازمان شما ضروری هستند ممکن است آسیب ببینند یا حتی کاملاً از بین بروند. حملات سایبری، بلایای طبیعی (مثل سیل)، و خطاهای انسانی (مانند زمانی که یک گروه ساخت‌وساز به طور تصادفی خط برق را قطع می‌کند) از جمله مثال‌هایی از بحران‌هایی هستند که ممکن است روند ارائه محصول یا خدمات را برای ساعاتی یا حتی روزها در سازمان مختل کنند. به طور کلی فاجعه در زمینه امنیت سایبری به هر رویداد غیرمنتظره‌ای اشاره دارد که به طور قابل‌توجهی سازمان را در معرض خطر قرار می‌دهد، زیرا با عملیات های ضروری تداخل ایجاد می‌کند.

حمله سایبری نیز یک فاجعه انسانی محسوب می‌شود، زیرا غیرمنتظره است و می‌تواند عملکرد کسب‌وکار شما را به طور منفی تحت تأثیر قرار دهد. در بسیاری از موارد، یک وقفه ممکن است به حد یک فاجعه کامل نرسد، مانند زمانی که یک ژنراتور پشتیبان قادر به تأمین برق برای سیستم‌های ضروری است.

فرایند بازیابی فاجعه چگونه است؟

در صورتی که سروری به دلیل یک فاجعه طبیعی از کار بیفتد، کسب‌وکار باید اطمینان حاصل کند که می‌تواند داده‌های از دست‌ رفته را در یک سرور ثانویه که داده‌ها در آن پشتیبان‌گیری شده‌اند، بازیابی کند. با یک DRP خوب، کسب‌وکار می‌تواند تمام بار کاری ضروری را با کمترین زمان قطعی به مکانی دیگر منتقل کند.

یک DRP خوب باید اتفاقاتی را که به موقعیت جغرافیایی وابسته هستند یا بدون توجه به موقعیت جغرافیایی رخ می‌دهند، در نظر بگیرد. به طور مثال، اگر یک سرور که برای نگهداری بکاپ و بازیابی داده ها در زمان فاجعه استفاده می‌شود، یک مایل از محل کسب‌وکار شما فاصله داشته باشد، ممکن است برای کمک به سازمان در بازیابی دیتا پس از یک حمله سایبری کافی باشد. اما اگر سیل گسترده یا طوفان رخ دهد، احتمال زیادی وجود دارد که دیتاسنتری که سرور بکاپ شما در آن قرار داد نیز تحت تأثیر قرار گیرد.

چه زمانی از Disaster Recovery استفاده می‌شود؟

Disaster Recovery زمانی مورد استفاده قرار می گیرد که یک رویداد، به‌طور جدی توانایی عملکرد عادی سازمان را برای مدت زمان قابل‌توجهی تحت تأثیر قرار دهد. مثل:

حملات سایبری: حملات DDoS، باج‌افزارها (ransomware) و انواع دیگر حملات سایبری می‌توانند داده‌های حساس را به خطر بیندازند، خدمات را مختل کرده و باعث از کار افتادگی سیستم شوند. در این صورت واکنش سازمان‌ها ممکن است شامل ایزوله‌سازی سامانه‌های آسیب‌دیده، بازیابی اطلاعات از نسخه‌های پشتیبان، و تقویت تدابیر امنیتی باشد.
بلایای طبیعی: زمین‌لرزه، سیل، طوفان یا آتش‌سوزی ممکن است به‌صورت فیزیکی به دیتاسنتر، دفاتر یا شبکه‌های ارتباطی آسیب وارد کرده و شما را از ادامه فعالیت‌ متوقف کند. حال در این شرایط ممکن است نیاز به انتقال سرور ها به محل‌های جایگزین، بازگردانی اطلاعات از نسخه‌های پشتیبان و تأمین امنیت کارکنان باشد.
قطعی برق: قطعی طولانی‌مدت برق می‌تواند سرورها، تجهیزات شبکه و خدمات ابری را مختل کرده و منجر به از کار افتادگی و خرابی داده‌ها شود. برای بازیابی، سازمان ممکن است نیاز به استفاده از ژنراتورهای پشتیبان، UPS ها و دیتاسنتر های جایگزین (failover data centers) داشته باشد.
خرابی سخت‌افزار یا سامانه‌ها: از کار افتادن سرورهای حیاتی یا آسیب به قطعات به خصوص سخت افزار های ذخیره سازی می‌تواند باعث توقف خدمات و از دسترس خارج شدن سامانه‌های کلیدی شود. در این شرایط راه حل معمولاً تعویض سخت‌افزار یا بازیابی دیتا از نسخه‌های پشتیبان یا پیاده‌سازی Redundancy است.
خطاهای انسانی: حذف ناخواسته داده‌ها یا پیکربندی اشتباه می‌تواند منجر به از بین رفتن دیتا و نقض امنیت شود. در مواجهه با چنین مواردی راه حل، بازیابی داده‌ها از نسخه‌های پشتیبان، اعمال کنترل‌های دسترسی دقیق‌تر، و آموزش کارکنان برای پیشگیری از وقوع مجدد خواهد بود.

هنگام وقوع چنین وقایعی، تیم فنی، شدت بحران پیش آمده را ارزیابی کرده و تصمیم می‌گیرد که آیا اجرای DRP ضروری است یا خیر. در صورت تشخیص وقوع بحران، تیم، از مراحل از پیش‌تعریف‌شده در DRP برای بازگردانی دیتا و عملکرد سازمان پیروی می‌کند.

اهداف Disaster Recovery چیست؟

هدف نهایی از Disaster Recovery، کاهش تأثیر یک بحران و تضمین تداوم کسب‌وکار (business continuity) است. وجود یک Disaster Recovery خوب می‌تواند به سازمان کمک کند تا:

کاهش زمان توقف: اجرای یک پلن Disaster Recovery خوب، می تواند زمان از کار افتادگی سیستم‌ها و خدمات را به حداقل برساند.
کاهش خسارت مالی: Disaster Recovery با از سرگیری سریع عملیات، از کاهش درآمد جلوگیری می کند.
محافظت از داده‌های حیاتی: در شرایط بحرانی، بکاپ گیری و مکانیسم‌های failover مانع از دست رفتن داده‌های مهم می‌شود.
بازگشت سریع به عملیات: با تعریف اهداف مشخص برای زمان بازیابی (RTO) و مراحل اجرای آن، سامانه‌ها با کمترین اختلال مجدداً آنلاین می‌شوند.
رعایت تعهدات در قرارداد سازمان: با بازگردانی روند ارائه خدمات به حالت عادی، در بازه‌های زمانی توافق‌شده، تعهدات قراردادی حفظ می‌شود و از جرایم احتمالی جلوگیری می‌گردد.
ایجاد آرامش ذهنی برای کارکنان: با فراهم کردن برنامه‌ای ساختارمند برای پاسخ‌گویی به بحران، از فشار روانی و سردرگمی جلوگیری می‌شود.
حفاظت از اعتبار سازمان: واکنش سریع و مؤثر به بحران، آسیب به اعتبار برند و اعتماد مشتریان را به حداقل می‌رساند.
پاسخ‌گویی به الزامات انطباق: بسیاری از چارچوب‌های امنیتی و حریم خصوصی نظیر SOC 2، ISO 27001، HIPAA، PCI DSS و GDPR، داشتن فرآیند بازیابی پس از بحران مستند در قالب DRP را الزامی کرده‌اند.

تکنیک های Disaster Recovery

چندین تکنیک برای Disaster Recovery وجود دارد، و سازمان می‌تواند یک یا ترکیبی از چند تکنیک را انتخاب کند که با موقعیت آن‌ها سازگار باشد.

پشتیبان‌گیری: پشتیبان‌گیری ابتدایی‌ترین تکنیک Disaster Recovery است. پشتیبان‌گیری شامل ذخیره داده‌ها در خارج از محل یا در یک درایو قابل‌حمل است. پشتیبان‌گیری به تنهایی معمولاً ناکافی است زیرا زیرساخت شبکه همچنان بدون راه‌حل بازیابی باقی می‌ماند.
سایت سرد: هنگامی که سازمان از یک سایت سرد استفاده می‌کند، برخی از ضروری‌ترین عناصر زیرساخت خود را در یک سایت راه دور که به ندرت استفاده می‌شود، راه‌اندازی می‌کند. اگر فاجعه‌ای رخ دهد، کارکنان می‌توانند به سایت سرد نقل مکان کنند و کار خود را از سر بگیرند. از آنجا که سایت سرد معمولاً نمی‌تواند داده‌ها را بازیابی یا محافظت کند، ممکن است به تنهایی راه‌حل ناکافی باشد.
سایت گرم: یک سایت گرم دارای نسخه‌هایی از داده‌ها است که به طور منظم با داده‌های ضروری به‌روزرسانی می‌شوند. راه‌اندازی آن‌ها هزینه بیشتری دارد، اما امکان بازیابی کسب‌وکار با زمان قطعی بسیار کمتری را فراهم می‌کنند.
DRaaS: تکنیک DRaaS از خدمات ابری مدیریت‌شده برای بازیابی کامل اطلاعات و سیستم در مواجهه با فاجعه استفاده می‌کند.
BaaS: در تکنیک BaaS، یک شرکت میزبانی دیگر وظیفه پشتیبان‌گیری از داده‌های ضروری سازمان را بر عهده دارد.
مجازی‌سازی: با تکنیک مجازی‌سازی، سازمان می‌تواند عملیات و داده‌ها را در یک نسخه از بخش‌هایی از سیستم خود پشتیبان‌گیری کند. با برخی معماری‌ها، یک نسخه کامل در یک محیط مجازی‌سازی‌شده امکان‌پذیر است. ماشین‌های مجازی، که در خارج از محل قرار دارند، می‌توانند توسط سازمان برای ازسرگیری سریع عملیات استفاده شوند.
بازیابی فوری: در تکنیک بازیابی فوری، هم داده‌ها و هم کل ماشین مجازی در یک اسنپ شات گنجانده شده‌اند، که امکان بازیابی سریع داده‌ ها را فراهم می‌کند.

تفاوت برنامه Disaster Recovery با برنامه تداوم کسب‌وکار

برنامه بازیابی پس از بحران (DRP) و برنامه تداوم کسب‌وکار (Business Continuity Plan یا BCP) هر دو رویکردی پیشگیرانه برای کاهش تأثیر بحران دارند و حتی ممکن است با هم به کسب و کار شما کمک کنند. DRP بر بازگردانی سریع عملکرد سیستم‌های آسیب‌دیده تمرکز دارد، در حالی که BCP بر حفظ حداقلی عملکرد عملیات حتی در حین وقوع بحران تمرکز می‌کند. به‌عبارت دیگر، استراتژی Disaster Recovery کمک می‌کند تا سازمان پس از بحران به عملکرد کامل خود بازگردد، در حالی که Business Continuity کمک می‌کند تا سازمان حین بحران نیز در سطحی قابل قبول عملکرد خود ادامه دهد. به همین دلیل، وجود هر دو برنامه ضروری است یا باید استراتژی‌های بازیابی پس از بحران در قالب برنامه کلی تداوم کسب‌وکار گنجانده شود.

چه مواردی باید در برنامه Disaster Recovery گنجانده شود؟

همان‌گونه که دو کسب‌وکار شبیه به هم نیستند، هیچ دو برنامه Disaster Recovery نیز یکسان نیستند. با این حال، بیشتر آن‌ها شامل مؤلفه‌های مشترکی هستند که در ادامه شرح داده شده‌اند:

1. بکاپ گیری و بازیابی داده‌ها

بخشی از DRP باید به روش‌های بکاپ گیری از داده‌ها و بازیابی آن‌ها اختصاص یابد. این بخش باید شامل روش‌های بکاپ گیری، تناوب اجرای آن، محل ذخیره‌سازی داده‌ها، و مراحل محافظت و بازگردانی داده‌ها باشد. تیم مدیریت بحران سازمان باید مشخص کند که در صورت وقوع هر گونه فاجعه ای چه چیزی باید پشتیبان‌گیری یا منتقل شود. سازمان همچنین باید اطمینان حاصل کند که روش‌های پشتیبان‌گیری تعیین شده‌اند و همچنین مشخص کند چه کسی مسئول بکاپ گیری منظم و بازیابی داده ها خواهد بود.

2. سامانه‌ها و زیرساخت‌های Redundancy

بخش دیگری از DRP ممکن است شامل این باشد که چگونه سازمان از سامانه‌ها و زیرساخت‌های IT Redundancy استفاده می‌کند تا در صورت بروز بحران، از در دسترس بودن مداوم سیستم‌ها اطمینان حاصل شود. این امر ممکن است شامل رپلیکا سرورهای حیاتی، تجهیزات شبکه، منابع تغذیه و دستگاه‌های ذخیره‌سازی از طریق تکنولوژی‌هایی نظیر کلاسترینگ (clustering)، متعادل‌سازی بار (load balancing)، مکانیزم‌های failover، مجازی‌سازی (virtualization) یا سایر روش‌ها باشد.

3. محل جایگزین برای کار

در DRP باید مکان‌های جایگزینی که سازمان می‌تواند در صورت عدم دسترسی به محل اصلی در آن فعالیت کند مشخص شود. این بخش همچنین باید شامل زیرساخت‌ها و مراحل لازم برای انتقال سریع عملیات به این مکان‌ها باشد.

4. ارتباطات و اطلاع‌رسانی

بخش دیگری از DRP باید پروتکل‌های ارتباطی و رویه‌های اطلاع‌رسانی را تعریف کند تا در طول و پس از بحران ارتباطات حفظ شود. این پروتکل‌ها معمولاً شامل موارد زیر هستند:

اطلاع‌رسانی به تیم مدیریت، کارکنان، مشتریان، تأمین‌کنندگان و سایر ذی‌نفعان در خصوص بحران
ارائه به‌روزرسانی‌های منظم درباره پیشرفت کار
نگهداری اطلاعات تماس افراد کلیدی در سازمان و سرویس‌های اضطراری

5. اهداف بازیابی

در DRP باید بازه‌های زمانی قابل‌قبولی برای بازیابی سامانه‌ها و داده‌ها از نظر اهداف زمان بازیابی (Recovery Time Objectives یا RTO) و اهداف نقطه بازیابی (Recovery Point Objectives یا RPO) مشخص شوند. این اهداف بر اساس میزان اهمیت سیستم‌ها تعیین شده و استراتژی بازیابی بر پایه آن‌ها تنظیم می‌شود:

RTO: به حداکثر زمانی اشاره دارد که یک سازمان می‌تواند بدون سیستم خود، پس از یک فاجعه‌، به فعالیت عادی خود برگردد.
RPO: حداکثر میزان داده‌ای است که یک سازمان می‌تواند در صورت وقوع یک فاجعه یا حادثه از دست بدهد، بدون اینکه تأثیر منفی جدی بر کسب‌وکار داشته باشد.

6. تیم مدیریت بحران

سازمان ها باید تیمی از افراد را مسئول تدوین، اجرا، تست و مدیریت رویه ای برای عملکرد سازمان در هنگام و پس از فاجعه تعیین کنند. این رویه باید نقش هر عضو سازمان و مسئولیت‌های آن‌ها در صورت وقوع فاجعه را مشخص کند. در صورت بروز فاجعه، اعضای تیم باید روش‌های از پیش تعیین‌شده‌ای برای ارتباط با یکدیگر، کارکنان، مشتریان و فروشندگان داشته باشند. طرح ارتباطی باید خرابی‌های احتمالی زیرساخت را که ممکن است بر ایمیل و سایر روش‌های انتقال اطلاعات تأثیر منفی بگذارد، در نظر بگیرد.

7. ارزیابی ریسک

سازمان بایدخطرات مختلفی که احتمالاً نیاز به پیروی از رویه مدیریت بحران را ایجاد می‌کنند، شناسایی کند. سپس اقدامات مناسب باید بر اساس نوع بحران در نظر گرفته شوند. این ممکن است بسته به موقعیت جغرافیایی متفاوت باشد. طیف وسیعی از بلایای طبیعی، حتی آن‌هایی که غیرمعمول هستند نیز باید در نظر گرفته شوند.

8. تست و بررسی

تیم مدیریت بحران سازمان مسئول اطمینان از آماده بودن سیستم بازیابی عملکرد پس از فاجعه برای یک رویداد از طریق تست مداوم و به‌روزرسانی عناصر مختلف آن است. به عنوان مثال، برای حملات سایبری، تیم باید اطمینان حاصل کند که اقدامات امنیتی انجام شده روی سیستم به‌روز هستند و جدیدترین تهدیدات سایبری را نیز دفع می‌کنند.

خدمات Disaster Recovery زمین هاست

زمین هاست با ارائه راهکار های فناوری اطلاعات به‌روز، موثر و تست شده به کسب و کار ها و سازمان ها کمک می‌کند تا هر مشکلی را قبل از تبدیل شدن به یک بحران مدیریت کند. به طور مثال یکی از مشکلاتی که به تازگی کاربران وبسایت ها با آن موجه شده اند و بر درآمد، سئو سایت و رضایت مشتریان بسیاری از کسب و کار ها آسیب زده است این است که بسیاری از وب سایت ها برای موتور جست و جوی گوگل قابل مشاهده نیستند که این موضوع به شدت بر سئوی وب سایت ها تاثیر منفی داشته است و احتمال پنالتی گرفتن سایت ها را به دلیل ارور 404 به شدت افزایش داده است. در این بحران زمین هاست برای جلوگیری از افت سئو سایت با ملی شدن اینترنت از یک سرور خارجی به عنوان واسطه استفاده می کند و دیتای سایت را به کمک یک تونل برای پاسخ به درخواست های گوگل به سرور خارجی منتقل می کند و سپس سرور به درخواست گوگل پاسخ می دهد با این کار مشکل حل می شود. بنابراین این بحران به سادگی توسط تیم متخصص زمین هاست هم اکنون برای بسیاری از سازمان ها و کسب و کار ها رفع شده و برای آن ها تبدیل به برد شده است. اینجاست که ما یک بحران را به یک موقعیت برای موفقیت تبدیل می کنیم. این مورد تنها یکی از اقدامات زمین هاست بوده است.

برای دریافت مشاوره و ارائه راهکاری، موثر و به‌روز با کمترین هزینه

در یک بحران فناوری اطلاعات سازمانی با کارشناسان زمین هاست در ارتباط باشید.

۰۲۱-۹۱۰۹۶۲۶۵