Facebook приходит в себя после масштабного сбоя

Facebook приходит в себя после масштабного сбоя

Сервисы Facebook как корпорации – то есть, собственно, одноименной социальной сети, Instagram и WhatsApp — начали восстанавливаться примерно около часа ночи по московскому времени. По подсчетам специалистов, одна из крупнейших интернет-компаний пробыла в офлайне 6 часов. И это крупнейший сбой в истории Facebook, а возможно, и значимого интернет-бизнеса в целом. Что касается причин произошедшего, то детального анализа пока нет, но первые версии пока полностью подтверждаются.

Еще вечером заговорили, что ситуация похожа на сбой в настройке так называемых серверов доменных имен. Возможно, ошибка произошла при настройке сетевого оборудования. В итоге записи о самом существовании каких-то ресурсов в домене Facebook.com были удалены. А значит, пользователи просто не видели этих серверов — ни извне, ни изнутри системы.

Причем пользователи — это не обязательно люди, это и прочие компьютерные системы тоже. В частности, сообщалось, что отказала система безопасности на физических объектах Facebook, и инженеры, которым нужно бороться с глобальным сбоем, просто не могли попасть на территорию дата-центров, что не ускоряло процесс возвращения соцсетей и мессенджеров к жизни.

Впрочем, в одном ясность вроде как тоже была практически изначально. По крайней мере, в Qrator Labs — а это крупнейшие эксперты по защите от DDoS-атак, то есть специалисты по сохранению устойчивости высоконагруженных сетей — уверены в том, что все это было именно сбоем.

Александр Лямин, основатель и генеральный директор компании Qrator Labs: "У нас нет оснований предполагать по внешним признакам и динамике, что это атака. Похоже на то, что это отключение связано с внутренними причинами Facebook. И, насколько я помню, за всю историю это одно из самых длительных отключений, которое у них когда-либо было зарегистрировано".

Подобные сбои пусть редко, но случаются. Как правило, это человеческий фактор — например, у "Яндекса" в 2011 году сотрудники допустили аналогичную ошибку, ее устраняли несколько часов.

Другой вопрос, что теперь, десять лет спустя, значимость ресурсов такого масштаба возросла до критического уровня. Многие, и не только в западном мире, пользуются сервисами Facebook в том числе для работы — это маркетинг, продажи, взаимодействие с партнерами, клиентская поддержка. А в США во время сбоя был разгар рабочего дня.

А еще это история про связность технологического мира. Пользователи, которые не смогли зайти в Facebook, WhatsApp и Instagram, пошли в Twitter и Telegram — оба сервиса стали работать заметно медленнее из-за резко выросшей нагрузки.

Около 9 вечера по Москве сообщалось, что не выдержал наплыва пользователей даже "ВКонтакте". Были жалобы на качество связи сотовых операторов и провайдеров домашнего интернета. И это, повторюсь, речь о России, где Facebook не входит в список особо популярных соцсетей, а Instagram ночью, казалось бы, не критичен. Разве что WhatsApp, упавший вместе с материнской компанией, на первом месте в зачете мессенджеров, опережая тот же Telegram по аудитории втрое.

Наверное, совпадение, но интересно, что сбой произошел вскоре после того, как была раскрыта личность информатора, который последнее время поставлял американской прессе внутренние документы Facebook. Общий смысл их сводится к тому, что в корпорации прибыльность ставят выше безопасности. Речь шла преимущественно о контенте, но не исключено, что тот же подход исповедовался и по части техники.

Александр Лямин, основатель и генеральный директор компании Qrator Labs: "В среде сетевых инженеров принято рассматривать сеть как два слоя — слой передачи данных и слой управления. И достаточно часто, когда компания желает оптимизировать услуги, два слоя начинают неизбежное слияние. Управление и передача данных осуществляется по единой инфраструктуре. И с точки зрения экономики это прекрасная идея, с точки зрения восстановления при отказах — это идея очень плохая. Как мы можем наблюдать последние пять лет, "Яндекс" этот урок некоторое время назад выучил, а Facebook учит прямо сейчас".

Ну, а дополнительным стимулом для детального изучения произошедшего, очевидно, станут прямые финансовые потери. И речь даже не о тех миллиардах условного состояния, которые за эти шесть часов потерял лично глава Facebook Марк Цукерберг, а о потерях отрасли в целом и об убытках, например, корпоративных клиентов соцсети. А Facebook for Business восстанавливался едва ли не медленнее других сервисов.

Источник