به گزارش پایگاه خبری تحلیلی ساعد نیوز به نقل از دیجیاتو، همین اواخر یعنی 15 مردادماه نیز در کشور قطعی گسترده در چندین دیتاسنتر رخ داد که شبکه اینترنت در کشور را دچار آسیب کرد. این قطعی بهخاطر قطعی برق در پایتخت اتفاق افتاد. البته دفعات پیش نیز تقریباً دلایلی مشابه برای قطعی دیتاسنترها اعلام شد. اما چرا دیتاسنترها نمیتوانند با این موضوع کنار بیایند و دائماً مغلوب قطعی برق میشوند؟
مشکلات سختافزاری و نرمافزاری گریبانگیر دیتاسنترها
«محمد مظفری»، کارشناس فنی، در پاسخ به این پرسش که مشکل قطعی مکرر دیتاسنترها در روزهای اخیر به چه مواردی مربوط میشود، اعلام کرد: «خدمات دیتاسنتر در کشور ما چنین تعریفی دارد: تأمین چهار سرویس در کنار یکدیگر و بهصورت همزمان و بهشکلی که نیازهای حوزه فناوری اطلاعات را بهصورت 24 ساعته تأمین کند. این چهار سرویس شامل امنیت فیزیکی، برق مداوم، سیستم سرمایش و خنککننده مناسب و نیز پهنای باند است. هرکدام از دیتاسنترهایی که ما در کشور داریم درحال تأمین این موارد با روشهای مختلف و در مکانهای مختلف است. اگر در هرکدام از این موارد وقفه بهوجود بیاید، سبب میشود که آن دیتاسنتر از دسترس خارج گردد. تجربیات ما در سالهای گذشته نشان داده که ممکن است در مسیر ارتباطی مشکلات فیزیکی رخ دهد؛ نمونهاش آتشگرفتن و یا دزدیدهشدن فیبرهای نوری بود که باعث شد خدمات دیتاسنتر برای ساعتها با مشکل مواجه شود.»
مظفری میگوید برخی اختلالها به مسائل نرمافزاری برمیگردد: «در مورد اختلالهای نرمافزاری در شبکه هم تجربه زیادی داشتیم که بهدلیل حملات اینترنتی و یا ایراداتی در سوئیچ تبادل ترافیک و یا دیتاسنترهای زیرساخت، تقریباً بخش قابلتوجهی از دیگر دیتاسنترها دچار مشکل میشدند. در مورد برق اما امسال بیش از همیشه این قضیه بهچشم میخورد که دیتاسنترها مستقیماً بهدلیل اختلال برق دچار مشکل شدند. ضمن اینکه در مورد کولینگ (خنککردن سرورها) هم تجربیاتی داشتیم. اخیراً حتی چند مورد پیش آمده که بهدلیل مشکلات خنککننده، دیتاسنتر از مدار خارج شده است.»
براساس استانداردهای جهانی، دیتاسنترها به چند دسته مختلف تقسیم میشوند که بهاصطلاح به آن TIERبندی میگویند. دیتاسنترهای TIER از نوع سوم باید حداقل بتوانند 72 ساعت بیبرقی را تحمل کنند؛ اما در ایران دیتاسنترها با این دستهبندی، طبقهبندی نشدهاند. مظفری با اعلام این موضوع به دیجیاتو گفت: «دیتاسنترهای عمومی که به مشتریان عمومی خدمات ارائه میدهند (مثل آسیاتک، هایوب، شاتل و...)، ممکن نیست جایی ادعا کرده باشند که tr3 دارند. ممکن است در بخشهایی ادعا کرده باشند که ما سیستم پشتیبانی برقمان n+1 است، ولی اینکه ما با tr3 و الزاماتش منطبق باشیم وجود ندارد. این موضوع هم ناگفته باقی نماند که در برخی محافل گفته میشود اساساً دیتاسنترهایی که خدمات عمومی ارائه میدهند، صحبتی از TIERبندی در آنها نمیشود.»
او همچنین در پاسخ به این پرسش که چه چالشی در تأمین برق دیتاسنترها وجود دارد، گفت: «دیتاسنترها بهصورت خاص خودشان تولیدکننده برق نیستند و از شبکه توزیعی که بهصورت عمومی وجود دارد، برق تأمین میکنند. در کشور ما مشکل تأمین برق در همه اصناف وجود دارد. اما در کنار تأمین برق معمولی از شبکه توزیعی، راهحلهایی برای تأمین برق اضطراری برای دیتاسنترها وجود دارد. انتظار این است که این برق اضطراری را بهشکلی طراحی و پیشبینی کرده باشند که در قطع برقی در حدود 24 ساعت نیز با مشکل مواجه نشوند.»
به گفته مظفری، برخی نکات مثل تأمین سوخت برای سیستمهای برق اضطراری یا عدم وجود قطعات یدکی که برای آورهالشدن سیستمها و بهروزرسانی آنها موردنیاز است، میتواند روی موضوع تأمین برق اضطراری اثر بگذارد: «در موردی که اخیراً رخ داد، در دیتاسنتر مشکل قطع برق وجود نداشت. یعنی برق سیستم توزیع عمومی در شهر فعال بود ولی فرکانس ورودی برق تحت تأثیر قرار گرفت و باعث شد که سیستم برق اضطراری وارد مدار نشود. درحالیکه ابزارها و سرورها و سوئیچهای دیتاسنتر از کار افتادند، ولی سیستم برق اضطراری وارد مدار نشد. نکاتی از این دست که نیازمند قطعاتی خاصی هستند، میتوانند چالشهایی را برای دیتاسنترها بهوجود آورند.»
مظفری به مسئله اقتصاد دستوری اشاره کرد: «پایین نگهداشتن قیمتها بهصورت دستوری باعث تضعیف شرکتها شده و نمیتوانند برای تأمین قطعات بهتر اقدام کنند و در کنار آن باید به موضوع تحریمها هم اشاره کرد که باعث شده است استفاده از قطعاتی با برندهای معتبر سخت شود؛ چرا که یا نرخ خیلی بالایی دارند و یا از اساس در دسترس نیستند. این دو موضوع در پایداری خدمات تأثیر مستقیمی دارد که شاید کمتر بهچشم بیاید.»
اما اگر چکاپ روزانه و مدونی برای دیتاسنترها وجود داشته باشد، آیا امکان این موضوع وجود دارد که مشکلات کمتری گریبانگیر دیتاسنترها شود؟ مظفری باور دارد دیتاسنترهایی که دارای استانداردهایی مانند ایزو 27001 و ایزوهای سری 9 هزار هستند باید بهطور مداوم پایش شوند: «حتماً بخشی از آن به موضوع چکاپ دائمی سرویسهای اصلی متصل به برق اضطراری مربوط میشود. اما من تاکنون از دیتاسنترها گزارشی ندیدهام که بهصورت خاص به چگونگی پیادهسازی و بازبینی دورهای این استانداردها اشاره کند.»
عدم شفافیت نیز در این بخش مانند بسیاری از بخشهای دولت و حاکمیت، بیداد میکند. به گفته این کارشناس، دیتاسنترهای ایرانی برخلاف موارد جهانی، عملکردهای خود را بهطور شفاف نشان نمیدهند: «متأسفانه سیستم اطلاعرسانی در کشور ما خیلی شفاف نیست و آن چیزی که در دیتاسنترهای عمومی در دنیا مرسوم است، اینگونه است که دیتاسنترها درباره وضعیت سرویسها، تغییرات و حوادثی که اتفاق میافتد و همچنین آوردن تجربیات سازمانی و استراتژیها بهکاررفته در زمان حوادث در وبلاگهایشان اطلاعرسانی میکنند که این بهصورت عمومی در دسترس است. اما متأسفانه چنین فرهنگی در کشور ما وجود ندارد و شرکتها و دیتاسنترها این اطلاعات را به دلایل مختلف بهصورت عمومی منتشر نمیکنند.»
این قطعی جدا از ضررهای مالی که به کسبوکارها برای قطعشدن سرویسهایشان میزند، میتواند اطلاعات کاربران را نیز تحت تأثیر خود قرار دهد. باید بدانید تجهیزاتی که در دیتاسنترها استفاده میشود، چه از جنس تجهیزات شبکه و چه از جنس تجهیزات امنیتی، پردازشی و ذخیرهسازی، بهشکلی طراحی و ساخته شدهاند که مناسب استفاده دائمی هستند و باید بهصورت 24 ساعته فعال باشند. حتی بعضی از این تجهیزات دکمه روشن و خاموش ندارند.
درحقیقت قطعی دیتاسنتر میتواند مشکلات جبرانناپذیری به این تجهیزات وارد کند. مظفری دراینباره به دیجیاتو گفت: «پیشفرض این تجهیزات این است که بهصورت دائمی روشن هستند. در کنار آن، نرمافزارهایی هم که برای حوزه دیتاسنتر طراحی میشوند، با این سختافزارها و با این نگاه همخوانی دارند. نتیجه این نگاه و این مدل طراحی چیست؟ اگر به هر دلیلی ما حادثه قطعی و اختلال داشته باشیم، بهشکلی که سختافزارها و نرمافزارهایمان تحت تأثیر قرار بگیرند، مثل موضوع برق که تمام سختافزارها خاموش میشوند، بعد از آن ممکن است سختافزار ما در اتصال مجدد برق یا اگر نوسان ولتاژ یا تغییرات فرکانسی داشته باشیم، آسیب ببیند. همچنین در مورد نرمافزارها، سرویسهای نرمافزاری بهشکلی دیده شدهاند که بهصورت دائمی کار کنند و وقتی که در یک حادثهای مشابه آنچه در روزهای گذشته رخ داد، قطع میشوند، تنظیم و بالاآوردن مجدد آنها نیازمند چندین ساعت کار فنی است و ممکن است در برخی موارد حتی دیتای کاربران نیز تحت تأثیر قرار بگیرد و باعث شود که بخشی از دیتا را نیز از دست بدهیم.»
مظفری باور دارد اگر دیتاسنترها به مفهوم بهاشتراکگذاری دادههای خود بیشتر پایبند باشند میتوان از پیشآمدن مجدد این مشکلات جلوگیری کرد. او تأکید دارد اگر شرکتها درباره مشکلاتی که برایشان پیش آمده است و راهحلهایی که برای رفع آن بهکار گرفتهاند صحبت کنند، یک موضوع تکراری و یکسان برای همه پیش نمیآید و میتوانند با استفاده از تجربیات، در برابر مشکلات احتمالی در آینده مصون بمانند.
«محمدعلی میهنخواه»، مدیرمحصول آسیاتک نیز درباره چرایی اتفاقات اخیر پیشآمده برای دیتاسنترها به دیجیاتو گفت: «عمده مسائل پیشآمده برای دیتاسنترها ناشی از قطعی برق است، اما ما در آسیاتک این موضوع را در دیتاسنترهایمان نداشتیم و بلافاصله بعد از قطعیهای برق، ژنراتورهای ما فعال شدند. ما برق سرورهایمان را به طرق مختلف تأمین میکنیم و در این مدت کمترین اختلال را روی سرویسهای آسیاتک داشتیم. میزان اختلالها در دیتاسنترهای مختلف، متفاوت است.»
میهنخواه در پاسخ به سؤال دیجیاتو مبنی بر اینکه چرا الزاماتی برای تأمین برق در زمان مشکلات رعایت نمیشود و آیا چالشی برای تأمین برق اضطراری مثل نبود گازوئیل وجود دارد، گفت: «برخی دیتاسنترها درزمینه تأمین برق اضطراری ضعیف عمل میکنند. سیاست هر شرکت در تأمین برق سرورها متفاوت است، اما ما بعضاً در دوره سرویسدهی خود برای بررسی سلامتهای زیرساختمان، به برق اضطراری سوئیچ میکنیم که البته بههیچعنوان مشتریانمان لحظه سوئیچ را احساس نمیکنند. بحث تأمین برق اضطراری عملاً به موضوع سرمایهگذاری بازمیگردد. تأمین تجهیزات موردنیاز هزینههای بالایی دارد و علاوه بر تأمین برق اضطراری دیتاسنتر بایستی به مسائلی همچون سرمایش هم توجه کرد که دمای دیتاسنترها بالا نرود. اگر این ساختار درست رعایت نشود، چالشهای زیادی میتواند ایجاد کند.»
در حین قطعی دیتاسنترها پلتفرمهای متعددی با مشکل روبهرو میشوند و یکی از مواردی که مردم سریعاً به اختلال موجود در آن پی میبرند، اسنپفود است. اسنپفود بارها و بارها با این مشکل روبهرو شده و ضررهای زیادی را از این قطعیها تحمل کرده و در برخی موارد بیش از 50 درصد فروش معمول خود را از دست داده است. میهنخواه در پاسخ به این سؤال که چنین قطعیهایی چه ضرر و زیانی به مشتریان و ارائهدهندگان سرور وارد میکند، گفت: «ضرر و زیان سمت سرویسگیرنده، از دسترس خارجشدن وبسایت و پلتفرمشان است که در برخی موارد مشکلات مالی زیادی بهبار میآورد. مثل موضوعی که چند وقت پیش برای اسنپ و یا زرینپال رخ داد و چند ساعت از دسترس مشتریانش خارج شد و احتمالاً ضررهای مالی زیادی به آنها زده شد.»
به گفته میهنخواه، این قطعیهای برق برای ارائهدهندگان سرور هزینهبردار است؛ چرا که باید هزینههای چند صد میلیاردی برای ارائه سرویس پایدار به مشتریانشان انجام دهند. در غیر این صورت مشتریان خود را از دست میدهند؛ موضوعی که به اعتقاد او، هماکنون نیز رخ داده است و برخی کسبوکارها درحال جابهجایی محصول خود از روی سرورهای یک شرکت به شرکت دیگر هستند.
حادثه برای بزرگترین شرکتها هم رخ میدهد و نباید در این حوادث فقط بهدنبال مقصر بود؛ مقصر چه خود شرکتها باشند و چه نهادهای بالادستی و رگولاتور، در صورتمسئله تفاوتی ایجاد نمیکند. اما از آنسو باید برنامهریزی درستی ایجاد کرد تا این حوادث تکرار نشود. تا به امروز هیچیک از این دیتاسنترها لااقل بهطور شفاف اعلام نکردهاند که چقدر میتوانند در آینده قابل اتکا باشند. دیتاسنترهای بخش خصوصی و دولتی در ماههای اخیر بارها و بارها دچار مشکل شدهاند و تنها پاسخی که به افکار عمومی داده شده، این است که مشکل در ظرف چند دقیقه حل خواهد شد؛ غافل از اینکه «دقایقی» که از آن صحبت میشود، انبوهی از کسبوکارها و میلیونها کاربر را برای ساعتهای متمادی درگیر خود کرده است و مشکلات بزرگ مالی و غیرمالی برای همه بهوجود میآورد.