Более 15 лет в ИТ, опыт — от системного администратора до SRE Team Lead. Успел поработать в РЖД, Промсвязьбанке, сейчас работаю в Тинькофф инженером по надежности (SRE).
Специализируюсь на обеспечении наблюдаемости (мониторинг):
архитектура и построение систем мониторинга, а также процессов вокруг мониторинга
создание удобных и понятных дашбордов
правильное использование метрик
системы логирования (ELK, Graylog)
алертинг и оповещения
Обладаю опытом SRE: построение процесса дежурств, написание постмортемов, архитектура отказоустойчивых сервисов, написание и мониторинг SLA.
Есть опыт руководителя (Team/Tech Lead SRE): планирование, приоритезация, работа с обратной связью, ревью, обучение.
Также постоянно провожу собеседования по потоку SRE.