Пока мы спали, интернет был в оффлайне — небольшая ошибка в конфигурации одного из роутеров в backbone Cloudflare привела к тому, что солидная часть локаций сервиса начала отправлять весь трафик через этот роутер в Атланте, быстро его положив. Насколько я понимаю, недоступность локации выражалась как в отказе обслуживать запросы локальных для нее пользователей, так и обрабатывать трафик с локальных для нее origin-серверов. Если учесть, что среди затронутых инцидентом датацентров были точки в Амстердаме, Франкфурте, Лондоне, Париже и Москве — то есть места густого сосредоточения хостинг провайдеров, — то легко понять уровень напряжения в Cloudflare.
В блоге компании подробный разбор инцидента с выявленными ошибками, специалисты несколько раз повторяют, что это не была атака, действительно, просто ошибка в конфигурации, приведшая к тому, что один роутер объявил маршрут к себе самым приоритетным и те, кто успел этот маршрут увидеть, его и положили.