Развиваю подходы и помогаю энтузиастам во внедрении практик отказоустойчивости, надёжности, SRE, решении инцидентов. Системно внедрял в организациях постмортемы, качественный анализ инцидентов, DORA, graceful degradation, модели зрелости команд и инженерных практик, проводил адаптацию требований навыков эксплуатации в найме разработчиков и DevOps-специалистов, SRE.
Последние внедренные проекты:
SLO
Chaos Engineering
Observability
Scoring / уровни критичности
Change management
Изучил большое количество материалов по DevOps, SRE, Team Topologies, проектному управлению. Собрал с нуля SRE направление, встроенное в уровень принятия решений всей организации.
С 2023 года рассказываю о пройденных ошибках на конференциях HighLoad++ и DevOpsConf.
Активный участник сообщества Resilience in Software Foundation.
Поделюсь практическими примерами и рекомендациям как с инженерами, так и руководителями.
Как популяризировать подходы к отказоустойчивости в команде, в организации;
Как выгореть на on-call и чем от этого защититься;
Что делать с отторжением практик и как обеспечить "buy in" со стороны руководителей;
Как эксплуатации улучшить взаимодействие с платформенными командами, продуктовыми командами, продуктом и бизнесом; И наоборот!
Как стать лидером мнений в компании и искать единомышленников;
Чего не стоит делать с моделями зрелости инженеров, как перестать бороться за KPI.
Помогу на примерах со сложными коммуникационными блокерами во внедрении идей, практик;
Расскажу об организации собственного времени в непрерывном потоке встреч и задач;
Как в условиях стресса сохранять команду сплочённой (или не очень), заинтересованной, работоспособной.
С чего начать в направлении SRE;