RELIABILITY.md
Этот файл задаёт, как система доказывает, что она здорова и перезапускаема.
Стандартные пути
- Bootstrap:
[команда] - Верификация:
[команда] - Запуск приложения или сервиса:
[команда] - Отладка или инспекция рантайма:
[команда]
Обязательные рантайм-сигналы
- структурированные логи для запуска и критичных потоков
- health-проверки для ключевых сервисов
- данные трейсинга или таймингов для медленных путей, когда доступно
- видимые пользователю состояния ошибок для восстановимых сбоев
Golden journeys
[сценарий 1][сценарий 2][сценарий 3]
У каждого golden journey должен быть повторяемый путь верификации и понятные сигналы сбоя.
Правила надёжности
- Ни одна фича не считается завершённой, если после неё система не может чисто перезапуститься.
- Сбои в рантайме должны быть диагностируемы по локальным сигналам репозитория.
- Если появляется повторяющийся режим сбоя, добавьте бенчмарк или ограничитель для него.
- Уборка — часть надёжности, а не отдельная забота.