Логи Cloudflare остановлены на 3,5 часа
- Облачное сияние Облачное сияние
- Инцидент длился в общей сложности 3,5 часа, что привело к потере 55% журналов.
- Несмотря на пятиминутное исправление, ошибка вызвала сопутствующие проблемы
Облачное сияние Облачное сияние Облачное сияние журналы данных для своих клиентов половина (55%) журналов.
Смущенная произошедшая ошибка, калифорнийская компания извинилась перед клиентами в Сообщение в блоге, пообещав, что подобная проблема больше не повторяется.
Cloudflare Cloudflare Cloudflare Cloudflare Cloudflare Cloudflare Cloudflare Cloudflare быть создано таким образом, чтобы защитить себя в случае возникновения более масштабных проблемы.
Cloudflare призналась в потере журналов данных
Cloudflare Logpush, который собирает и отправляет журналы из своей глобальной сети сети клиентов для соответствия, отладки и аналитики. Это привело к неправильной настройке сервиса, что и вызвало проблему.
Компания утверждает, что ошибка конфигурации фактически была сообщена одному из ее внутренних устройств серверов, Logfwdr, что ни один из ее клиентов не настроил авторку журналов, что привело к потере провоцировала более глубокую ошибку.
Встроенный отказоустойчивый механизм, который отправляет журналы клиентам, а не только тем, у кого активны задания Logpush, в конце концов перегрузил систему буферизации Buftee обработка в 40 раз больше ее обычных мощностей, что сделало систему вынужденной неотзывчивой.
«Мы признаем, что ошибки и неправильные настройки неизбежны. Все наши системы в Cloudflare должны реагировать на них недорого и изысканно», — написала компания.
Cloudflare взяла на себя проведение регулярных испытаний для имитации этой ошибки, чтобы быть уверенной в том, что ее система сможет продолжайте с будущими ошибками необычного характера.