Начинал карьеру как сисадмин со специализацией по Linux, работал сетевиком в небольшом провайдере. Переехал в Питер и устроился на работу инженером в один из дата-центров Selectel. Оттуда перешел в команду облачной инфраструктуры и работал там несколько лет. На тот момент я сильно заточился на работу с железом, ядром Linux, сетями и распределенным стораджем на базе ceph. Масштабные сбои, баги в железе, и горы проблем научили меня как выстраивать работу с критичными системами.
Я всегда увлекался темой производительности систем. А она тесно связана с отладкой, которой приходилось заниматься очень и очень много. Я полностью перестроил мониторинг в отделе инфраструктуры, пройдя две большие итерации: от заббикса, через collectd к prometheus и victoriametrics.
После этого я перешел в Тинькофф на позицию SRE, а позднее лида SRE-команды voicekit. Фокус моей работы был направлен на повышение надежности продукта: от обсервабилити до внятного SLA для клиентов. Сейчас я снова ушел в инфраструктуру и руковожу командой разработки распределенного фаервола.
Для инженеров:
— научу работать со сложными системами: как подойти к поиску первопричин, как эффективно устранять аварии, как работать с проблемами системно
— объясню подходы к построению надежной инфраструктуры, архитектуры, продукта
— помогу разобраться с ядром Linux: как к нему подойти, куда смотреть, с кем разговаривать, как дебажить
— расскажу все, что знаю про тестирование производительности систем
— расскажу как эффективно использовать вайбкодинг, какие есть ограничения и как с этим быть
Для руководителей
— помогу разобраться с производительностью команды, оценкой капасити, процессами вокруг эффективности
— расскажу как работать с инженерами разных уровней: от стажеров до синьеров-помидоров
— разберу конфликтные ситуации
Готов рассмотреть любые темы.
Формат работы:
Вы описываете ситуацию и какой результат хотите получить. Я задаю уточняющие вопросы. Если я понимаю, что я смогу помочь, мы договариваемся о созвоне и обсуждаем ваш кейс.