На самом деле всё не так очевидно.
Их сайт - это 150+ микросервисов (считай, отдельных приложений), каждый из которых обвешан вспомогательными службами. При этом они друг с другом взаимодействуют.
Возможных причин ошибки могут быть сотни: ошибка в данных при взаимодействии, сбой софта/оборудования в инфраструктуре под пиковыми нагрузками, сбой в распределенной бд, сбой в планировщике работы и взаимодействия процессов, баг в коде смежного сервиса, выход из строя вспомогательного софта для поддержания работы сервиса, ошибка в рандомной библиотеке и т.п.