برای هر سازمان یا کسب و کاری ممکن است یک بحران یا فاجعه اتفاق بیفتد که عملکرد آن ها را به شدت تحت تاثیر قرار دهد اما چیزی که یک سازمان یا کسب و کار را از شکست حتمی نجات می دهد داشتن یک برنامه دقیق، بهروز و تست شده برای مواقع بروز بحران است. در این زمان مفهوم بازیابی پس از بحران یا فاجعه (Disaster Recovery یا DR) معنا پیدا می کند. Disaster Recovery مجموعهای مستند و دقیق از رویههایی است که برای به حداقل رساندن زمان مورد نیاز برای بازیابی عملکرد سازمان طراحی شده است.
نداشتن یک برنامه Disaster Recovery میتواند بهطور جدی توانایی یک سازمان برای بازیابی دادههای از دسترفته را مختل کند. این امر ممکن است منجر به خسارات مالی بسیار بیشتر و آسیب به اعتبار سازمان شود. حال برای اطمینان از اینکه سازمان شما بتواند در سریعترین و آسانترین حالت ممکن از بحران عبور کند، ابتدا باید بدانید Disaster Recovery چیست و چگونه باید آن را پیاده سازی کرد، در ادامه شما را با این مفهوم آشنا می کنیم.
Disaster Recovery چیست؟
بازیابی پس از بحران یا فاجعه (Disaster Recovery یا DR) روشی است برای مدیریت بحران که از طریق آن روند عادی کار پس از وقوع یک فاجعه از سر گرفته میشود. این امر معمولاً با از سرگیری فعالیتهای حیاتی انجام میشود. به عبارت دیگر Disaster Recovery مجموعهای مستند و دقیق از رویههایی است که برای به حداقل رساندن زمان مورد نیاز برای بازیابی عملکرد سازمان طراحی شده است. این رویهها مشخص میکند که سازمان برای بازیابی و بازگردانی سامانهها، عملیات و دادههای حیاتی خود پس از وقوع یک بحران، باید از چه مراحلی پیروی کنند. بخشی از اکثر طرحهای بازیابی فاجعه شامل بازیابی دسترسی به دادهها، نرمافزارها، سختافزارها، تجهیزات شبکه، اتصالات و برق است.
منظور از فاجعه در امنیت سایبری چیست؟
در برخی شرایط، امکاناتی که برای سازمان شما ضروری هستند ممکن است آسیب ببینند یا حتی کاملاً از بین بروند. حملات سایبری، بلایای طبیعی (مثل سیل)، و خطاهای انسانی (مانند زمانی که یک گروه ساختوساز به طور تصادفی خط برق را قطع میکند) از جمله مثالهایی از بحرانهایی هستند که ممکن است روند ارائه محصول یا خدمات را برای ساعاتی یا حتی روزها در سازمان مختل کنند. به طور کلی فاجعه در زمینه امنیت سایبری به هر رویداد غیرمنتظرهای اشاره دارد که به طور قابلتوجهی سازمان را در معرض خطر قرار میدهد، زیرا با عملیات های ضروری تداخل ایجاد میکند.
حمله سایبری نیز یک فاجعه انسانی محسوب میشود، زیرا غیرمنتظره است و میتواند عملکرد کسبوکار شما را به طور منفی تحت تأثیر قرار دهد. در بسیاری از موارد، یک وقفه ممکن است به حد یک فاجعه کامل نرسد، مانند زمانی که یک ژنراتور پشتیبان قادر به تأمین برق برای سیستمهای ضروری است.
فرایند بازیابی فاجعه چگونه است؟
در صورتی که سروری به دلیل یک فاجعه طبیعی از کار بیفتد، کسبوکار باید اطمینان حاصل کند که میتواند دادههای از دست رفته را در یک سرور ثانویه که دادهها در آن پشتیبانگیری شدهاند، بازیابی کند. با یک DRP خوب، کسبوکار میتواند تمام بار کاری ضروری را با کمترین زمان قطعی به مکانی دیگر منتقل کند.
یک DRP خوب باید اتفاقاتی را که به موقعیت جغرافیایی وابسته هستند یا بدون توجه به موقعیت جغرافیایی رخ میدهند، در نظر بگیرد. به طور مثال، اگر یک سرور که برای نگهداری بکاپ و بازیابی داده ها در زمان فاجعه استفاده میشود، یک مایل از محل کسبوکار شما فاصله داشته باشد، ممکن است برای کمک به سازمان در بازیابی دیتا پس از یک حمله سایبری کافی باشد. اما اگر سیل گسترده یا طوفان رخ دهد، احتمال زیادی وجود دارد که دیتاسنتری که سرور بکاپ شما در آن قرار داد نیز تحت تأثیر قرار گیرد.
چه زمانی از Disaster Recovery استفاده میشود؟
Disaster Recovery زمانی مورد استفاده قرار می گیرد که یک رویداد، بهطور جدی توانایی عملکرد عادی سازمان را برای مدت زمان قابلتوجهی تحت تأثیر قرار دهد. مثل:
- حملات سایبری: حملات DDoS، باجافزارها (ransomware) و انواع دیگر حملات سایبری میتوانند دادههای حساس را به خطر بیندازند، خدمات را مختل کرده و باعث از کار افتادگی سیستم شوند. در این صورت واکنش سازمانها ممکن است شامل ایزولهسازی سامانههای آسیبدیده، بازیابی اطلاعات از نسخههای پشتیبان، و تقویت تدابیر امنیتی باشد.
- بلایای طبیعی: زمینلرزه، سیل، طوفان یا آتشسوزی ممکن است بهصورت فیزیکی به دیتاسنتر، دفاتر یا شبکههای ارتباطی آسیب وارد کرده و شما را از ادامه فعالیت متوقف کند. حال در این شرایط ممکن است نیاز به انتقال سرور ها به محلهای جایگزین، بازگردانی اطلاعات از نسخههای پشتیبان و تأمین امنیت کارکنان باشد.
- قطعی برق: قطعی طولانیمدت برق میتواند سرورها، تجهیزات شبکه و خدمات ابری را مختل کرده و منجر به از کار افتادگی و خرابی دادهها شود. برای بازیابی، سازمان ممکن است نیاز به استفاده از ژنراتورهای پشتیبان، UPS ها و دیتاسنتر های جایگزین (failover data centers) داشته باشد.
- خرابی سختافزار یا سامانهها: از کار افتادن سرورهای حیاتی یا آسیب به قطعات به خصوص سخت افزار های ذخیره سازی میتواند باعث توقف خدمات و از دسترس خارج شدن سامانههای کلیدی شود. در این شرایط راه حل معمولاً تعویض سختافزار یا بازیابی دیتا از نسخههای پشتیبان یا پیادهسازی Redundancy است.
- خطاهای انسانی: حذف ناخواسته دادهها یا پیکربندی اشتباه میتواند منجر به از بین رفتن دیتا و نقض امنیت شود. در مواجهه با چنین مواردی راه حل، بازیابی دادهها از نسخههای پشتیبان، اعمال کنترلهای دسترسی دقیقتر، و آموزش کارکنان برای پیشگیری از وقوع مجدد خواهد بود.
هنگام وقوع چنین وقایعی، تیم فنی، شدت بحران پیش آمده را ارزیابی کرده و تصمیم میگیرد که آیا اجرای DRP ضروری است یا خیر. در صورت تشخیص وقوع بحران، تیم، از مراحل از پیشتعریفشده در DRP برای بازگردانی دیتا و عملکرد سازمان پیروی میکند.
اهداف Disaster Recovery چیست؟
هدف نهایی از Disaster Recovery، کاهش تأثیر یک بحران و تضمین تداوم کسبوکار (business continuity) است. وجود یک Disaster Recovery خوب میتواند به سازمان کمک کند تا:
- کاهش زمان توقف: اجرای یک پلن Disaster Recovery خوب، می تواند زمان از کار افتادگی سیستمها و خدمات را به حداقل برساند.
- کاهش خسارت مالی: Disaster Recovery با از سرگیری سریع عملیات، از کاهش درآمد جلوگیری می کند.
- محافظت از دادههای حیاتی: در شرایط بحرانی، بکاپ گیری و مکانیسمهای failover مانع از دست رفتن دادههای مهم میشود.
- بازگشت سریع به عملیات: با تعریف اهداف مشخص برای زمان بازیابی (RTO) و مراحل اجرای آن، سامانهها با کمترین اختلال مجدداً آنلاین میشوند.
- رعایت تعهدات در قرارداد سازمان: با بازگردانی روند ارائه خدمات به حالت عادی، در بازههای زمانی توافقشده، تعهدات قراردادی حفظ میشود و از جرایم احتمالی جلوگیری میگردد.
- ایجاد آرامش ذهنی برای کارکنان: با فراهم کردن برنامهای ساختارمند برای پاسخگویی به بحران، از فشار روانی و سردرگمی جلوگیری میشود.
- حفاظت از اعتبار سازمان: واکنش سریع و مؤثر به بحران، آسیب به اعتبار برند و اعتماد مشتریان را به حداقل میرساند.
- پاسخگویی به الزامات انطباق: بسیاری از چارچوبهای امنیتی و حریم خصوصی نظیر SOC 2، ISO 27001، HIPAA، PCI DSS و GDPR، داشتن فرآیند بازیابی پس از بحران مستند در قالب DRP را الزامی کردهاند.
تکنیک های Disaster Recovery
چندین تکنیک برای Disaster Recovery وجود دارد، و سازمان میتواند یک یا ترکیبی از چند تکنیک را انتخاب کند که با موقعیت آنها سازگار باشد.
- پشتیبانگیری: پشتیبانگیری ابتداییترین تکنیک Disaster Recovery است. پشتیبانگیری شامل ذخیره دادهها در خارج از محل یا در یک درایو قابلحمل است. پشتیبانگیری به تنهایی معمولاً ناکافی است زیرا زیرساخت شبکه همچنان بدون راهحل بازیابی باقی میماند.
- سایت سرد: هنگامی که سازمان از یک سایت سرد استفاده میکند، برخی از ضروریترین عناصر زیرساخت خود را در یک سایت راه دور که به ندرت استفاده میشود، راهاندازی میکند. اگر فاجعهای رخ دهد، کارکنان میتوانند به سایت سرد نقل مکان کنند و کار خود را از سر بگیرند. از آنجا که سایت سرد معمولاً نمیتواند دادهها را بازیابی یا محافظت کند، ممکن است به تنهایی راهحل ناکافی باشد.
- سایت گرم: یک سایت گرم دارای نسخههایی از دادهها است که به طور منظم با دادههای ضروری بهروزرسانی میشوند. راهاندازی آنها هزینه بیشتری دارد، اما امکان بازیابی کسبوکار با زمان قطعی بسیار کمتری را فراهم میکنند.
- DRaaS: تکنیک DRaaS از خدمات ابری مدیریتشده برای بازیابی کامل اطلاعات و سیستم در مواجهه با فاجعه استفاده میکند.
- BaaS: در تکنیک BaaS، یک شرکت میزبانی دیگر وظیفه پشتیبانگیری از دادههای ضروری سازمان را بر عهده دارد.
- مجازیسازی: با تکنیک مجازیسازی، سازمان میتواند عملیات و دادهها را در یک نسخه از بخشهایی از سیستم خود پشتیبانگیری کند. با برخی معماریها، یک نسخه کامل در یک محیط مجازیسازیشده امکانپذیر است. ماشینهای مجازی، که در خارج از محل قرار دارند، میتوانند توسط سازمان برای ازسرگیری سریع عملیات استفاده شوند.
- بازیابی فوری: در تکنیک بازیابی فوری، هم دادهها و هم کل ماشین مجازی در یک اسنپ شات گنجانده شدهاند، که امکان بازیابی سریع داده ها را فراهم میکند.
تفاوت برنامه Disaster Recovery با برنامه تداوم کسبوکار
برنامه بازیابی پس از بحران (DRP) و برنامه تداوم کسبوکار (Business Continuity Plan یا BCP) هر دو رویکردی پیشگیرانه برای کاهش تأثیر بحران دارند و حتی ممکن است با هم به کسب و کار شما کمک کنند. DRP بر بازگردانی سریع عملکرد سیستمهای آسیبدیده تمرکز دارد، در حالی که BCP بر حفظ حداقلی عملکرد عملیات حتی در حین وقوع بحران تمرکز میکند. بهعبارت دیگر، استراتژی Disaster Recovery کمک میکند تا سازمان پس از بحران به عملکرد کامل خود بازگردد، در حالی که Business Continuity کمک میکند تا سازمان حین بحران نیز در سطحی قابل قبول عملکرد خود ادامه دهد. به همین دلیل، وجود هر دو برنامه ضروری است یا باید استراتژیهای بازیابی پس از بحران در قالب برنامه کلی تداوم کسبوکار گنجانده شود.
چه مواردی باید در برنامه Disaster Recovery گنجانده شود؟
همانگونه که دو کسبوکار شبیه به هم نیستند، هیچ دو برنامه Disaster Recovery نیز یکسان نیستند. با این حال، بیشتر آنها شامل مؤلفههای مشترکی هستند که در ادامه شرح داده شدهاند:
1. بکاپ گیری و بازیابی دادهها
بخشی از DRP باید به روشهای بکاپ گیری از دادهها و بازیابی آنها اختصاص یابد. این بخش باید شامل روشهای بکاپ گیری، تناوب اجرای آن، محل ذخیرهسازی دادهها، و مراحل محافظت و بازگردانی دادهها باشد. تیم مدیریت بحران سازمان باید مشخص کند که در صورت وقوع هر گونه فاجعه ای چه چیزی باید پشتیبانگیری یا منتقل شود. سازمان همچنین باید اطمینان حاصل کند که روشهای پشتیبانگیری تعیین شدهاند و همچنین مشخص کند چه کسی مسئول بکاپ گیری منظم و بازیابی داده ها خواهد بود.
2. سامانهها و زیرساختهای Redundancy
بخش دیگری از DRP ممکن است شامل این باشد که چگونه سازمان از سامانهها و زیرساختهای IT Redundancy استفاده میکند تا در صورت بروز بحران، از در دسترس بودن مداوم سیستمها اطمینان حاصل شود. این امر ممکن است شامل رپلیکا سرورهای حیاتی، تجهیزات شبکه، منابع تغذیه و دستگاههای ذخیرهسازی از طریق تکنولوژیهایی نظیر کلاسترینگ (clustering)، متعادلسازی بار (load balancing)، مکانیزمهای failover، مجازیسازی (virtualization) یا سایر روشها باشد.
3. محل جایگزین برای کار
در DRP باید مکانهای جایگزینی که سازمان میتواند در صورت عدم دسترسی به محل اصلی در آن فعالیت کند مشخص شود. این بخش همچنین باید شامل زیرساختها و مراحل لازم برای انتقال سریع عملیات به این مکانها باشد.
4. ارتباطات و اطلاعرسانی
بخش دیگری از DRP باید پروتکلهای ارتباطی و رویههای اطلاعرسانی را تعریف کند تا در طول و پس از بحران ارتباطات حفظ شود. این پروتکلها معمولاً شامل موارد زیر هستند:
- اطلاعرسانی به تیم مدیریت، کارکنان، مشتریان، تأمینکنندگان و سایر ذینفعان در خصوص بحران
- ارائه بهروزرسانیهای منظم درباره پیشرفت کار
- نگهداری اطلاعات تماس افراد کلیدی در سازمان و سرویسهای اضطراری
5. اهداف بازیابی
در DRP باید بازههای زمانی قابلقبولی برای بازیابی سامانهها و دادهها از نظر اهداف زمان بازیابی (Recovery Time Objectives یا RTO) و اهداف نقطه بازیابی (Recovery Point Objectives یا RPO) مشخص شوند. این اهداف بر اساس میزان اهمیت سیستمها تعیین شده و استراتژی بازیابی بر پایه آنها تنظیم میشود:
- RTO: به حداکثر زمانی اشاره دارد که یک سازمان میتواند بدون سیستم خود، پس از یک فاجعه، به فعالیت عادی خود برگردد.
- RPO: حداکثر میزان دادهای است که یک سازمان میتواند در صورت وقوع یک فاجعه یا حادثه از دست بدهد، بدون اینکه تأثیر منفی جدی بر کسبوکار داشته باشد.
6. تیم مدیریت بحران
سازمان ها باید تیمی از افراد را مسئول تدوین، اجرا، تست و مدیریت رویه ای برای عملکرد سازمان در هنگام و پس از فاجعه تعیین کنند. این رویه باید نقش هر عضو سازمان و مسئولیتهای آنها در صورت وقوع فاجعه را مشخص کند. در صورت بروز فاجعه، اعضای تیم باید روشهای از پیش تعیینشدهای برای ارتباط با یکدیگر، کارکنان، مشتریان و فروشندگان داشته باشند. طرح ارتباطی باید خرابیهای احتمالی زیرساخت را که ممکن است بر ایمیل و سایر روشهای انتقال اطلاعات تأثیر منفی بگذارد، در نظر بگیرد.
7. ارزیابی ریسک
سازمان بایدخطرات مختلفی که احتمالاً نیاز به پیروی از رویه مدیریت بحران را ایجاد میکنند، شناسایی کند. سپس اقدامات مناسب باید بر اساس نوع بحران در نظر گرفته شوند. این ممکن است بسته به موقعیت جغرافیایی متفاوت باشد. طیف وسیعی از بلایای طبیعی، حتی آنهایی که غیرمعمول هستند نیز باید در نظر گرفته شوند.
8. تست و بررسی
تیم مدیریت بحران سازمان مسئول اطمینان از آماده بودن سیستم بازیابی عملکرد پس از فاجعه برای یک رویداد از طریق تست مداوم و بهروزرسانی عناصر مختلف آن است. به عنوان مثال، برای حملات سایبری، تیم باید اطمینان حاصل کند که اقدامات امنیتی انجام شده روی سیستم بهروز هستند و جدیدترین تهدیدات سایبری را نیز دفع میکنند.
خدمات Disaster Recovery زمین هاست
زمین هاست با ارائه راهکار های فناوری اطلاعات بهروز، موثر و تست شده به کسب و کار ها و سازمان ها کمک میکند تا هر مشکلی را قبل از تبدیل شدن به یک بحران مدیریت کند. به طور مثال یکی از مشکلاتی که به تازگی کاربران وبسایت ها با آن موجه شده اند و بر درآمد، سئو سایت و رضایت مشتریان بسیاری از کسب و کار ها آسیب زده است این است که بسیاری از وب سایت ها برای موتور جست و جوی گوگل قابل مشاهده نیستند که این موضوع به شدت بر سئوی وب سایت ها تاثیر منفی داشته است و احتمال پنالتی گرفتن سایت ها را به دلیل ارور 404 به شدت افزایش داده است. در این بحران زمین هاست برای جلوگیری از افت سئو سایت با ملی شدن اینترنت از یک سرور خارجی به عنوان واسطه استفاده می کند و دیتای سایت را به کمک یک تونل برای پاسخ به درخواست های گوگل به سرور خارجی منتقل می کند و سپس سرور به درخواست گوگل پاسخ می دهد با این کار مشکل حل می شود. بنابراین این بحران به سادگی توسط تیم متخصص زمین هاست هم اکنون برای بسیاری از سازمان ها و کسب و کار ها رفع شده و برای آن ها تبدیل به برد شده است. اینجاست که ما یک بحران را به یک موقعیت برای موفقیت تبدیل می کنیم. این مورد تنها یکی از اقدامات زمین هاست بوده است.
برای دریافت مشاوره و ارائه راهکاری، موثر و بهروز با کمترین هزینه
در یک بحران فناوری اطلاعات سازمانی با کارشناسان زمین هاست در ارتباط باشید.