Facebook объяснила причину масштабного сбоя в работе своих сервисов

сбой в работе сервис Facebook Instagram WhatsApp Messenger дата-центр
В понедельник Facebook, Instagram, WhatsApp, Messenger и Oculus VR оставались недоступными в течение 6 часов.

Facebook объяснила причину масштабного сбоя в работе своих сервисов

Компания Facebook опубликовала официальное объяснение масштабному сбою в работе своих сервисов в понедельник, 4 октября, и извинилась перед пользователями.
Напомним , вчера Facebook, Instagram, WhatsApp, Messenger и Oculus VR ушли в offline и оставались недоступными в течение шести часов. Ходили слухи, что причиной сбоя в работе сервисов стало неудачное обновление Border Gateway Protocol (BGP), и официальное заявление компании это подтверждает.
Вице-президент Facebook по инженерии и инфраструктуре Сантош Джанардхан (Santosh Janardhan) принес извинения пользователям за причиненные «неудобства» и пояснил, что изменение настроек конфигурации маршрутизаторов привело к сбою соединения между дата-центрами Facebook.
«Нашим командам инженеров стало известно, что изменения настроек конфигурации магистральных маршрутизаторов, координирующих сетевой трафик между нашими дата-центрами, привело к сбоям в связи. Этот сбой в сетевом трафике вызвал каскадный эффект в наших дата-центрах и отключение наших сервисов», — сообщил Джанардхан.
Это объяснение подтверждает информацию, ранее предоставленную компанией Cloudflare, отследившей проблему до сбоя BGP, затронувшего маршрутизацию трафика. В то время некоторые предполагали, что причиной сбоя стала обычная ошибка конфигурации DNS, однако вскоре эта теория была отброшена, поскольку DNS-сервисы функционировали, но не отвечали.
Как сообщил Джанардхан, сбой также затронул внутренние инструменты Facebook, что усложнило диагностику и устранение проблемы. По данным The New York Times, инженеры безопасности не могли получить физический доступ к затронутым серверам, поскольку их цифровые пропуска не работали.
Facebook развеяла слухи о хакерской атаке и подчеркнула, что сбой был вызван проблемным изменением настроек конфигурации, и пользовательские данные не пострадали.

SECURITYLAB.RU

Источник