أعلنت شركة أمازون أن ذراعها للحوسبة السحابية خدمات أمازون ويب (Amazon Web Services – AWS) واجهت انقطاعات واسعة في الطاقة والاتصال داخل عدد من مراكز البيانات في كل من الإمارات والبحرين، عقب تعرض أحد المرافق الحيوية في منطقة الإمارات لما وصفته الشركة بـ”أجسام” أصابته وأدت إلى شرارات كهربائية تسببت في حريق داخلي وإجراءات إيقاف طارئة للأنظمة الكهربائية.
وقعت الحادثة عند نحو الساعة 4:30 مساءً بتوقيت دبي يوم الأحد، الموافق 12:30 ظهراً بتوقيت غرينتش، عندما تعرض أحد مراكز البيانات عالية الكثافة (High-Density Data Center Facility) لضربة أدت إلى اضطراب فوري في منظومة توزيع الطاقة الكهربائية داخل المنشأة. وأوضحت الشركة أن فرق الطوارئ الهندسية قامت بتفعيل بروتوكولات العزل الكهربائي وإيقاف المولدات الاحتياطية (Backup Generators) بشكل احترازي أثناء عمليات الإطفاء، ما أدى إلى خروج إحدى مناطق التوافر عن الخدمة بشكل كامل وتعطل جزئي في منطقة أخرى.
انقطاع في مناطق التوافر وتأثر البنية السحابية الإقليمية
أكدت الشركة أن اثنتين من مناطق التوافر (Availability Zones) داخل منطقة الإمارات السحابية فقدتا الطاقة مؤقتاً، بينما واجهت منطقة البحرين مشكلات في الاتصال الشبكي (Network Connectivity) واستقرار الطاقة. وتُعد مناطق التوافر وحدات معزولة تصميمياً ضمن البنية التحتية السحابية الموزعة (Distributed Cloud Infrastructure)، حيث يتم فصلها عبر دوائر كهربائية مستقلة وأنظمة تبريد منفصلة لتقليل مخاطر الانقطاع المتزامن.
ويعتمد تصميم هذه المناطق على مبدأ التكرار المزدوج (Redundancy Architecture) بحيث تحتوي كل منطقة على عدة قاعات خوادم (Server Halls) مرتبطة بشبكات ألياف ضوئية عالية السعة، إضافة إلى أنظمة تغذية طاقة غير منقطعة (Uninterruptible Power Supply – UPS) تعمل على توفير طاقة فورية في حال فقدان المصدر الرئيسي.
تشغّل الشركة عالمياً ما يقارب 123 منطقة توافر موزعة على 39 منطقة جغرافية، ما يسمح بإعادة توجيه الأحمال التشغيلية عبر آليات التحويل التلقائي (Failover Mechanisms) وموازنة الأحمال (Load Balancing). إلا أن الحادث الأخير تسبب في اضطراب مباشر للخدمات الإقليمية، خصوصاً التطبيقات التي تعتمد على نشر أحادي المنطقة (Single-Region Deployment) بدلاً من اعتماد هيكلية متعددة المناطق (Multi-Region Architecture).
وأوضحت الشركة أن التعافي الكامل قد يستغرق “ساعات طويلة”، مشيرة إلى استمرار فرقها الفنية في معالجة مشكلات ارتفاع معدلات الأخطاء (Error Rate Spikes) وانخفاض زمن الاستجابة في بعض الخدمات، وهو ما يؤثر مباشرة على التطبيقات الحساسة مثل قواعد البيانات المُدارة (Managed Databases) والخدمات المصغرة (Microservices) وواجهات البرمجة (API Endpoints).
كيف يؤثر الحريق على أنظمة الحوسبة السحابية؟
تعتمد مراكز البيانات فائقة السعة (Hyperscale Data Centers) على أنظمة طاقة وتبريد معقدة تشمل أنظمة توزيع طاقة مزدوجة (Redundant Power Distribution Units – PDU) وأنظمة تبريد تعتم على السوائل (Liquid Cooling Systems) أو تبريد هوائي عالي الكفاءة. وعند وقوع شرارات كهربائية، يتم تفعيل بروتوكولات الإيقاف الطارئ لمنع انتقال الأحمال الكهربائية غير المستقرة إلى الخوادم (Servers).
إيقاف الطاقة المفاجئ، حتى لو كان احترازياً، قد يؤدي إلى توقف آلاف الخوادم الافتراضية (Virtual Machines) وتعطيل عمليات المعالجة الفورية (Real-Time Processing). كما يمكن أن يتسبب في انقطاع مؤقت لخدمات التخزين الكائني (Object Storage) أو أنظمة التخزين الكتلي (Block Storage) إذا لم تكن مهيأة بنموذج تكرار متعدد المناطق.
من الناحية الحرارية، أي اضطراب في أنظمة التبريد (Cooling Systems) قد يؤدي إلى ارتفاع درجات الحرارة في غضون دقائق، وهو ما يشكل خطراً على المعالجات المركزية (CPU) ووحدات معالجة الرسوميات (GPU) المستخدمة في تطبيقات الذكاء الاصطناعي والتحليلات الضخمة.
سياق إقليمي وتداعيات جيوسياسية محتملة
جاءت الحادثة في ظل توترات أمنية إقليمية، ما أثار تساؤلات حول مدى تأثر البنية التحتية الرقمية الحرجة بالأحداث الجارية. ورغم أن الشركة لم تؤكد وجود صلة مباشرة، إلا أن توقيت الحادث يسلط الضوء على هشاشة البنية السحابية أمام المخاطر الفيزيائية في مناطق النزاع.
تعتمد اقتصادات الخليج بشكل متزايد على التحول الرقمي والخدمات السحابية في قطاعات مثل الخدمات المالية والطاقة والتجارة الإلكترونية. وبالتالي، فإن أي اضطراب في مركز بيانات إقليمي قد ينعكس على سلاسل الإمداد الرقمية وأنظمة المدفوعات والتطبيقات الحكومية.
تداعيات على القطاع المصرفي والأنظمة المالية
أعلن بنك أبوظبي التجاري (Abu Dhabi Commercial Bank – ADCB) عن تعرض بعض منصاته الرقمية وتطبيق الهاتف المحمول لمشكلات تقنية. ويعكس ذلك الاعتماد الكبير للمؤسسات المالية على خدمات الحوسبة السحابية العامة لتشغيل أنظمة معالجة المعاملات (Transaction Processing Systems) وأنظمة إدارة المخاطر (Risk Management Platforms).
في حال لم تعتمد المؤسسات نموذج النسخ الاحتياطي الجغرافي (Geo-Redundant Backup)، فإن الانقطاع في منطقة واحدة قد يؤدي إلى تأخر في تنفيذ العمليات أو تعطل خدمات العملاء. كما أن بعض البنوك تعتمد على مراكز بيانات سحابية محلية لتلبية متطلبات الامتثال التنظيمي (Regulatory Compliance) المتعلقة بتوطين البيانات.
إدارة الأزمة وخيارات التعافي التقني
أكدت الشركة أنها تعمل على تحويل حركة البيانات (Traffic Rerouting) إلى مناطق أخرى لتقليل الأثر على العملاء، مع مراقبة أداء الشبكات عبر أنظمة المراقبة اللحظية (Real-Time Monitoring Systems). ويُتوقع أن تشمل مراحل التعافي إعادة اختبار استقرار الشبكة (Network Stability Tests)، والتحقق من سلامة الأنظمة الكهربائية، وفحص مكونات مثل وحدات التحويل غير المنقطعة (UPS) ولوحات توزيع الطاقة (PDU).
حتى الآن، لم يتم الإعلان عن تقدير نهائي للخسائر أو مدة التوقف الكلي، إلا أن الحادث يسلط الضوء على أهمية تصميم بنى تحتية تعتمد على المرونة التشغيلية (Operational Resilience) والتحمل العالي للأعطال (High Availability Design) في المناطق ذات المخاطر الجيوسياسية.
يمثل هذا الحدث تذكيراً بأن التحول الرقمي لا ينفصل عن اعتبارات الأمن الفيزيائي واستقرار البنية التحتية الحرجة والأمن الجيوسياسي، وأن الاعتماد على الخدمات السحابية يتطلب استراتيجيات توزيع جغرافي متقدمة لضمان استمرار الأعمال حتى في أصعب الظروف.
المصدر: رويترز