почему не работает фейсбук это по русски баг файервол а по английски анекдот
Facebook объявила причину глобального сбоя
Спустя несколько часов после восстановления доступа к своим сервисам Facebook объявила причину глобального сбоя. Компания уточнила, что авария произошла из-за изменения конфигурации магистральных маршрутизаторов, которые координируют сетевой трафик между центрами обработки данных Facebook. Их перенастройка вызвала проблемы, которые прервали связь. Нарушение сетевого трафика также оказало каскадное влияние на способы связи с центрами обработки данных, в результате чего внешние и внутренние сетевые услуги были остановлены.
Facebook не пояснила, кто был инициатором изменений конфигурации маршрутизаторов и почему они были сделаны. Компания рассказала, что из-за сбоя перестали работать многие внутренние инструменты и системы, которые инженеры Facebook используют в повседневной работе, что серьезно усложнило попытки быстро диагностировать и решить проблему.
Инцидент с недоступностью Facebook, Instagram и WhatsApp по всему миру длился около 6 часов. Специалисты компании занимались устранением сбоя, но не могли его решить оперативно. Оказалось, что для этого нужно физическое присутствие сетевых инженеров для устранения проблемы на маршрутизаторах в дата-центрах Facebook. Компания срочно направила группу специалистов в дата-центр в Санта-Кларе, чтобы попробовать вручную перезапустить сервера и разобраться с конфигурацией маршрутизаторов. В это же время стало известно, что внутренняя сеть компании также стала недоступна, включая корпоративные сегменты, сервера DNS, сервисы и инструменты. Из-за этого специалисты не могли проникнуть внутрь периметра дата-центров — у них не срабатывали пропуски.
Предварительная причина инцидента, о которой заявили многие эксперты — удаленное обновление конфигурации маршрутизаторов внутри сети компании, отвечающих за BGP-сессии и их анонсы, а также автономную систему Facebook, пошло не по плану. После этого перестали быть доступны NS-сервера компании и пропали DNS-записи. Список префиксов FB, с которыми пропала глобальная связность: IPv4, IPv6.
Из-за чего Facebook стал глобально недоступен. Технический ликбез
Прим. перев.: в этой статье инженеры онлайн-сервиса Cloudflare весьма популярно объясняют, что именно (технически) произошло с недоступностью Facebook минувшим вечером (4-го октября 2021), а также затрагивают тему того, как этот сбой повлиял на более глобальные процессы в интернете.
«Разве Facebook может упасть?» — задумались мы на секунду…
Сегодня в 16:51 UTC (в 19:51 MSK — прим. перев.) у нас был открыт внутренний инцидент под названием «Facebook DNS lookup returning SERVFAIL» («DNS-поиск для Facebook возвращает SERVFAIL»). Мы решили, что это с нашим DNS-ресолвером 1.1.1.1 что-то не так. Однако к моменту размещения соответствующего обновления на публичной статус-странице стало ясно, что здесь что-то серьёзное.
Социальные сети уже разрывались от сообщений о том, что быстро подтвердили и наши инженеры: Facebook и связанные с ним сервисы WhatsApp и Instagram действительно упали. Их DNS-имена больше не ресолвились, а IP-адреса инфраструктуры были недоступны. Выглядело так, как будто кто-то буквально выдернул кабели разом во всех их дата-центрах, отключив от интернета.
Как такое вообще возможно?
Встречайте BGP
BGP — это «протокол граничного шлюза» (Border Gateway Protocol). Это механизм для обмена информацией о маршрутизации между автономными системами (AS) в интернете. У больших роутеров, благодаря которым работает интернет, есть постоянно обновляемые списки возможных маршрутов, используемых для доставки каждого сетевого пакета до мест их назначения. Без BGP интернет-роутеры не знают, что делать, и интернет просто не будет работать.
Интернет — это буквально сеть из сетей, связанных между собой с помощью BGP. BGP позволяет одной сети (скажем, Facebook) объявлять о своём присутствии другим сетям, которые в конечном счёте формируют весь интернет. На момент написания этой статьи Facebook не сообщал о своём присутствии, поэтому интернет-провайдеры (ISP) и другие сети не могут найти сеть Facebook — она недоступна.
У индивидуальных сетей есть свой ASN — номер автономной системы (Autonomous System Number). Автономная система (AS) — это индивидуальная сеть с унифицированной политикой внутренней маршрутизации. AS может порождать специальные префиксы (означающие, что они контролируют группу IP-адресов), а также транзитные префиксы (они знают, как добраться до определённых групп IP-адресов).
Например, ASN у Cloudflare — AS13335. Каждая ASN должна объявить интернету о своих prefix routes с помощью BGP. В ином случае никто не узнает, как к ней подключиться и где найти её.
В этой упрощённой схеме можно увидеть шесть автономных систем в интернете и два возможных маршрута, по которым один пакет может пройти от начала (Start) до конца (End). Самый быстрый маршрут — это AS1 → AS2 → AS3. Самый медленный — AS1 → AS6 → AS5 → AS4 → AS3; он используется в случаях, когда первый не срабатывает.
В 16:58 UTC мы заметили, что Facebook перестал анонсировать маршруты для своих DNS-префиксов. Это означало, что по меньшей мере DNS-серверы Facebook были недоступны. По этой причине DNS-ресолвер Cloudflare (уже упомянутый 1.1.1.1) не мог отвечать на запросы, требующие выдать IP-адрес для домена facebook.com или instagram.com.
Хотя другие IP-адресы Facebook и имели маршруты в то же самое время, в них не было особого смысла, потому что DNS-службы Facebook и связанных сервисов были недоступны:
Мы следим за всеми обновлениями и анонсами в BGP, какие появляются в глобальной сети. Собираемые таким образом данные позволяют увидеть глобальные связи в интернете и понять, откуда и куда должен ходить весь трафик.
UPDATE-сообщение от BGP информирует роутер о любых изменениях, сделанных в префиксе, или о полном отзыве этого префикса. Проверяя базу данных BGP, основанную на временных рядах, мы можем точно увидеть количество обновлений, поступивших от Facebook’а. Обычно этот график довольно ровный: Facebook не будет постоянно делать большое количество изменений для своей сети.
Но около 15:40 UTC был замечен резкий всплеск изменений в маршрутах Facebook’а. Именно здесь и начались проблемы.
Ещё лучше будет видно, что же произошло, если разбить этот график на анонсы маршрутов и их отзывы. Маршруты были отозваны, DNS-серверы Facebook ушли в offline, а минутой позже возникла проблема: инженеры Cloudflare сидели и недоумевали, почему 1.1.1.1 не может получить IP для facebook.com, обеспокоенные каким-то сбоем в своих системах.
После отзыва этих маршрутов Facebook и его сайты были отключены от интернета.
DNS тоже в деле
Прямым последствием этого события стала невозможность для DNS-ресолверов со всего мира получать IP для связанных с проектами доменных имён:
Это происходит по той причине, что в DNS, как и во многих других системах в интернете, используется свой механизм маршрутизации. Когда кто-то набирает https://facebook.com в веб-браузере, DNS-ресолвер, ответственный за перевод доменного имени в реальный IP-адрес для фактического подключения, сначала проверяет, есть ли что-то в его кэше. Если кэш есть — он используется. Если кэша нет — производится попытка получить ответ от DNS-сервера, обычно расположенного где-то поблизости.
Если DNS-серверы недоступны или не могут дать ответ по какой-то другой причине, возвращается ответ SERVFAIL, а браузер показывает пользователю ошибку.
Опять же, в онлайн-центре обучения Cloudflare есть хорошее объяснение, как работает DNS.
Из-за того, что Facebook перестал анонсировать свои DNS prefix routes через BGP, наш и любой другой DNS-ресолвер не мог подключиться к DNS-серверам проекта. Поэтому, 1.1.1.1, 8.8.8.8 и другие крупные публичные DNS-ресолверы начали выдавать (и кэшировать) ответы SERVFAIL.
Но это ещё не всё. Теперь в дело включается человеческий фактор и логика работы приложения, что в совокупности приводит к экспоненциальному эффекту. От пользователей обрушивается огромная волна дополнительного DNS-трафика.
Отчасти это происходит по той причине, что приложения не расценивают ошибку как подходящий пользователю ответ и начинают делать повторные запросы, причем иногда очень активно. А отчасти — потому что конечные пользователи тоже не воспринимают ошибку за правильный для них результат и начинают обновлять страницы, убивать/перезапускать свои приложения, порой тоже весьма активно.
Всё это привело к резкому росту трафика (по количеству запросов), что мы наблюдали на 1.1.1.1:
Из-за того, что Facebook и его сайты так популярны, мы получили 30-кратную нагрузку на DNS-ресолверы по всему миру, а это может вызывать задержки и таймауты для других платформ.
К счастью, 1.1.1.1 был создан как бесплатный, приватный, быстрый (убедиться в этом можно в DNSPerf) и масштабируемый сервис, так что мы продолжали обслуживать своих пользователей с минимальными проблемами.
Скорость ответов на подавляющую часть DNS-запросов оставалась в диапазоне менее 10 мс. В то же время небольшая часть перцентилей p95 и p99 показали повышенное время ответов — вероятно, из-за истекших TTL при обращении к DNS-серверам Facebook и вызванных таймаутов. 10-секундный таймаут для DNS — значение, которое пользуется популярностью среди инженеров.
Влияние на другие сервисы
Люди ищут альтернатив, хотят знать и обсуждать, что происходит. Когда Facebook упал, мы увидели растущее число DNS-запросов к Twitter, Signal и другим социальным сетям и платформам для обмена сообщениями.
Также недоступность проявилась в статистике по WARP-трафику от и к автономной сети Facebook’а (ASN 32934). Эта карта показывает, как трафик изменился в интервале с 15:45 UTC до 16:45 UTC по сравнению с тремя часами до этого в каждой стране. По всему миру WARP-трафик от и к сети Facebook практически исчез.
Интернет
Сегодняшние события служат мягким напоминанием о том, что интернет — это очень сложная и взаимозависимая система из миллионов систем и протоколов, взаимодействующих друг с другом. Доверие, стандартизация и кооперация между задействованными в нём организациями — ключ к его работоспособности для почти пяти миллиардов активных пользователей со всего мира.
Обновление
Около 21:00 UTC (полночь в MSK — прим. перев.) мы увидели новую BGP-активность в сети Facebook, пик которой пришёлся на 21:17 UTC:
График ниже показывает доступность DNS-имени ‘facebook.com’ на DNS-ресолвере 1.1.1.1. Она пропала около 15:50 UTC и вернулась в строй в 21:20 UTC:
Несомненно, сервисам Facebook, WhatsApp и Instagram ещё понадобится некоторое время, чтобы полностью вернуться в строй, но по состоянию на 21:28 UTC Facebook уже доступен в глобальном интернете, а его DNS снова функционирует.
Facebook не работает сегодня на телефоне или компьютере
На форумах и в поисковых запросах часто встречается вопрос, почему не работает Фейсбук сегодня, и что делать в такой ситуации. Эксперты выделяют несколько причин появления такой сообщений — сбои на стороне сервера, загрязнение кэша, действие вирусов или отсутствие подключения к Сети. Рассмотрим, как действовать, если Фейсбук вдруг перестал работать именно сегодня и сейчас, а имеющихся знаний недостаточно для устранения проблемы.
Почему не работает Facebook сегодня — причины и решение
На практике существует несколько причин, почему пользователь не может войти в Фейсбук и авторизоваться под своими данными для общения с друзьями. Выделим основные.
Отсутствие Интернета
Распространенная причина, почему не работает Facebook сегодня — отсутствие подключения к Интернету. В таком случае нужно проверить факт соединения с Сетью путем входа на любой другой сайт (к примеру, Гугл). Если не удается зайти ни на один ресурс, причин может быть много — неправильная настройка или неисправность роутера, сбои в подключении компьютера, проблемы у провайдера и т. д. Это отдельная тема, поэтому вникать в нее не будем.
Если сегодня не работает только интересующая соцсеть, проблема в другом. В ситуации, когда другие сайты нормально загружаются, а Facebook нет, проверьте ПК на вирусы (об этом пойдет речь ниже).
Действие вирусного ПО
Пользователи часто паникуют, если не могут войти в любимые соцсети. Они спрашивают, что случилось с Фейсбуком, почему не могу зайти, ведь у других людей сегодня все работает нормально. Если браузер не «пускает» на конкретный сайт (в том числе Facebook) и пишет, что нет возможности отобразить страницу или нужно пройти активацию по SMS, причина — вирус в ПК. Высока вероятность, что какая-то зловредная программа добралась до файла host и внесла в нее изменения.
Чтобы решить проблему сегодня и получить доступ к соцсети, сделайте такие шаги:
Нажмите на файл правой кнопкой мыши и выберите открытие с помощью Блокнота или Notepad. Изучите содержание документа и удалите из него все лишние ссылки на сайты, в первую очередь Facebook.com. Будьте внимательны, ведь вирус может добавить надписи, которые внешне похожи на название Фейсбука, но отличаются одной или несколькими буквами.
После удаления лишних данных сохраните изменения в Host и закройте папку. Теперь проверьте, работает Фейсбук или нет. Проделайте эту операцию прямо сегодня. Возможно, в указанном файле уже есть заблокированные сайты. В дальнейшем во избежание проблемы защитите ПК от вирусов. Установите лицензионное ПО, а также включите брандмауэр Виндовс. Для решения задачи войдите в меню Пуск, далее Панель управления. Там выберите Безопасность и брандмауэр Windows, войдите в раздел и жмите на кнопку включения.
Если после выполненных действий Фейсбук не работает, причина в другом, к примеру, в сбоях самого поставщика услуги.
Сбои в работе сервера
Если официальный сайт и мессенджер Фейсбук не работают сегодня у многих людей, это может свидетельствовать о проблемах на стороне сервера. Последние события показали, что такие случаи не являются редкостью. Только в 2019 году произошло несколько серьезных событий:
Если по какой-то причине Фейсбук не работает, можно задать вопрос на русском форуме или пообщаться в специальных темах ВКонтакте. Если другие пользователи сегодня столкнулись с такой же проблемой, она имеет глобальный характер. В таком случае необходимо подождать, пока компания решит возникшие проблемы.
Что еще можно сделать?
Если сегодня вдруг не работает Фейсбук, можно предпринять дополнительные шаги. Рассмотрим их подробнее:
Если сегодня не работает Фейсбук, не нужно паниковать. Причина может лежать на поверхности. Во многих случаях это банальное отсутствие Интернета. В других ситуациях причиной может быть действие вирусов или сбои в работе сервера. В последнем случае придется набраться терпения и дождаться, пока проблемы будут устранены. Судя по практике, на восстановление системы уходит не более нескольких часов.
Цифровой апокалипсис: последствия глобального сбоя в работе Facebook, WhatsApp и Instagram
CNBC: сбой в работе Facebook стал самым масштабным с 2008 года
Фото, видео: globallookpress.com / Karl-Josef Hildenbrand/dpa; 5-tv.ru
Мир приходит в себя после самого масштабного сбоя десятилетия. 4 октября около восьми часов были не доступны главные интернет-сервисы планеты.
Мир приходит в себя после самого масштабного интернет-сбоя десятилетия. Крупнейшая соцсеть Facebook лежала практически восьми часов. А вместе с ней WhatsApp и Instagram — все, что входит в IT-империю Марка Цукерберга. В корпорации пока подробно не комментируют, что же именно произошло.
Лишь скупая информация — мы все починили, спасибо, что вы до сих пор с нами. Вот только этот сбой отразился не только на Facebook.
Пострадали миллионы людей по всему миру, и вовсе не потому, что не могли просмотреть фотографии друзей или прокомментировать чей-то пост. Корреспондент МИЦ «Известия» Егор Ильченко выяснил, что ущерб уже оценивают в десятки миллиардов долларов.
Нераспознаваемый QR-код на мониторе и гробовая тишина в телефоне. Нет уведомлений о новых сообщениях, нельзя и самому никому написать. Как будто кто-то взял да и разорвал связь со всем миром. И только восемь часов спустя появились первые радостные сообщения пользователей! Facebook, а вместе с ним WhatsApp и Instagram наконец-то начали оживать.
Кто-то все это время просидел с телефоном, обновляя приложения. И дождался. Самое удивительное, что заявление представители Facebook опубликовали у главного конкурента — в Twitter появилась заметка о восстановлении работы самых популярных соцсетей планеты.
Чего это стоило программистам? — пока не ясно. Кто-то из журналистов, ссылаясь на собственные источники, писал, что серверы перезапускали чуть ли не в ручную, каждый отдельно, а их тысячи. Была информация, что даже в офис сотрудники попали не сразу — глобальный сбой якобы отключил систему безопасности в здании, и электронные пропуска оказались заблокированы. Все это время миллионы людей по всему миру кусали локти от отчаяния.
А кто-то и подсчитывал убытки. Ведь немало тех, кого соцсети попросту кормят.
«Я должен был снять рекламную маску, у меня нет сейчас такой возможности. Соответственно, я не могу зарабатывать деньги», — говорит блогер Павел Осадчий.
Убытки подсчитывают и в самом Facebook. Лично Марк Цукерберг во время затяжного интернет форс-мажора становился беднее чуть ли не на миллиард долларов в час — рекордная потеря личного состояния. Да и сами акции крупнейшей соцсети мира подешевели сразу на пять процентов.
И все, как предполагают, из-за ошибки кого-то из сотрудников. По данным британского журналиста Брайана Кребса, ресурсные адреса сайтов удалили из так называемых глобальных таблиц маршрутизации. Именно они помогают браузерам отыскать нужные страницы. Еще дна версия — система рухнула из-за обновления программного обеспечения компании.
«Возможно, велись хакерские атаки, а именно DDoS-атака, которая привела к масштабному сбою в работе Facebook, Instagram и WhatsApp», — считает программист Сергей Вакулин.
И эта версия ужа начала подтверждаться. Неизвестная ранее группировка CBT заявила: это их хакеры взломали серверы Facebook. И в качестве доказательства выложили 600 терабайт личных данных пользователей. Не только электронные, но и реальные адреса, номера телефонов и фрагменты переписки. Впрочем, по словам экономистов, даже после такого провала существенного оттока пользователей корпорация не ощутит.
«Альтернативы этим крупным социальным сетям нет. И пользователи, несмотря на то, что потерпят определенные моральные страдания из-за того, что есть риск засветки личных данных, вряд ли большинство из них покинет социальные сети», — говорит экономист Андрей Колганов.
Но вслед за Facebook о проблемах начали заявлять и в других соцсетях. Рухнул даже самый популярный сервис Downdetector — он специализируется на отслеживании проблем в интернете. Начал подвисать и Telegram — туда ринулись 50 миллионов новых пользователей — искали альтернативу WhatsApp.
«Переводя на русский язык это гигантская DDoS-атака, которую мы создаем сами. Возможно, где-то WhatsApp пытается подняться, для серверов это колоссальные нагрузки, и дальше идет сужение каналов, многие увидели ухудшение трафика», — убежден деятель российской IT индустрии Герман Клименко.
Помимо денежных потерь Facebook понес и репутационные. Доверие к соцсети подорвано. Но многие, как ни странно, даже отнеслись к этому с юмором, уже увековечив самый мощный сбой десятилетия целой серией мемов. На которых в «победителях» — Telegram, отделавшийся «малой кровью».
Тем временем экс-сотрудник американского агентства нацбезопасности Эдвард Сноуден написал в Twitter, что из-за интернет-сбоя мир хотя бы на несколько часов стал здоровее. И даже предложил подумать о создании неких альтернативных каналов связи. Общаясь через которые, пользователи будут спокойны за личные данные.
Автор фото, Reuters
Компания Facebook извинилась за сбой в работе своих соцсетей во всем мире. В понедельник вечером основная соцсеть компании отключилась на несколько часов.
Соцсеть «Инстаграм» и мессенджер WhatsApp, которые тоже принадлежат Facebook, прекратили работу вместе с ее основной соцсетью.
В чем была проблема?
Это как будто кто-то вырвал кабели из всех дата-центров одновременно, и отсоединил системы от интернета, объясняют в компании Cloudflare, которая специализируется на сетевой инфраструктуре.
Объяснение компании Facebook было более техническим.
Что это значит?
Чтобы провести пользователя на страницу, на которую он хочет попасть, этот протокол намечает все возможные маршруты информации и выбирает оптимальный.
В понедельник сервера Facebook перестали предоставлять информацию, необходимую для работы протокола.
Это значит, что пользователи потеряли связь с системами Facebook, а значит и «Инстаграм» и WhatsApp.
Бывшая сотрудница Facebook о правилах работы компании
Почему этому позволили произойти?
Около 16:45 по Лондону (18:45 по московскому времени) начали появляться сообщения о том, что соцсети компании Facebook прекратили работу.
Сначала интернет отреагировал обычными шутками, а не упавший «Твиттер» начал иронизировать над конкурентами.
Корреспондент New York Times Шира Френкель сказала Би-би-си, что решение проблемы заняло столько времени потому что люди, пытавшиеся понять, в чем проблема, физически не могли попасть в здание.
Как отреагировали в Facebook
Основатель соцсети Марк Цукерберг вынужден был извиниться в «Твиттере».
Аналитик Марк Прул считает, что произошедшее вновь поднимает вопросы о том, к чему привело объединение большой части технических операторов соцсети в одну систему.
Некоторые аналитики считают, что этот сбой и вообще все подобные сбои последних годов демонстрируют, что концентрация большой части мировых коммуникационных сетей в руках нескольких глобальных компаний может обернуться проблемой.
Потеря доступа к соцсети для многих стала просто небольшим неудобством, но для малого бизнеса в развивающихся странах это была катастрофа.
Для других пользователей это значило полную потерю связи с друзьями и родственниками.
Сколько потеряно?
Для самой компании Facebook самым серьезным последствием сбоя будет падение ее акций и прибыли. На платформах больше шести часов не размещалась реклама.
Некоторые аналитики считают, что сбой обошелся Facebook более чем в шесть млрд. долларов. Ее акции упали более чем на 5%.
Сегодняшний день тоже может принести компании проблемы. Перед Сенатом США предстанет инсайдер, ответственный за крупную утечку внутренних документов компании.
Проблемы у Facebook есть и с регуляторной точки зрения. Из утечки очевидно, что для этой компании прибыль важнее сотрудников.
К тому же на Facebook уже обратили внимание регуляторы в разных странах мира. Они считают, что компания, возможно, слишком большая, чтобы эффективно противодействовать таким вызовам, как дезинформация, возбуждение ненависти и попытки завладеть личной информацией пользователей.
Разумеется, в работе соцсети и раньше случались сбои, но как правило их устраняли примерно через час.
Сбои происходят не только по вине крупных соцсетевых фирм, но и зачастую из-за просчетов компаний сетевой инфраструктуры, таких как Cloudflare и Fastly. Это показывает, что проблемы с ключевой инфраструктурой в одной части планеты могут коснуться пользователей по всему миру.