чтобы такие тесты проводить это нужно чтобы и ПО было нормальное



такой тест — 100% закончится аварией
так зачем делать аварию добровольно?
лучше подождать «пока само не сгорит» и потом уже восстановиться

конечно МНОГОЕ можно сделать правильно и улучшить
но зачастую полноценный тест — это именно просто авария на часы или сутки и делать подобное желания нет

если авария затягивается на несколько дней — то это уже халтура и пренебрежение, это значит кто-то из команды поленился «подумать на перед что авария 100% когда-ниб будет»
на эту тему можно написать многое
лично я предпочитаю — дробить на мелкие части, если знаю что восстановить монолит качественно не получится
а кто не дробит — потом мучается

хороший совет не делать никогда больше 50 услуг

у меня нет не одного аккаунта в дата-центрах где более 50 серверов
у меня нет не одной VMmanager где более 50 узлов
почтовых доменов на каком либо сервере тоже
самих сайтов блогов вообще не более 10 штук на 1 сервер
все максимально раскидано по куче вещей

жаль что этот совет не все люди соблюдают
во первых это снижает риски
во вторых это ускоряет любое восстановление
в третьих запутывает вредителей
в четвертых это снижает банально нагрузку на продукты и я даже никогда в ТП поэтому не обращаюсь нигде

именно поэтому я ищу lowcost дедики или выгодные честные цены на 15 лет
потому что у меня сверх запасы «на будущее может пригодится»

если бы все делали так же
то куча сотрудников/помощников было бы не нужно
и крупных аварий простоев не было бы тоже никогда