Дмитрий Синявский

SRE @ Всеинструменты.ру | ex-Tabby, SRE
DevOps/SRE
System Design
Backend
Собеседования
Опыт: 10+ лет
Цена (за час): Бесплатно
Получили помощь: 4 человека
О себе

Работал 7 лет руководителем разработки ПО для телекоммуникаций (писали на Delphi/FreePascal, Go) в партнерстве с NEC (Япония) на ФГУП ЭЗАН, руководил разработкой системы управления магистральным оборудованием оптоволоконной связи.

С 2020 года бекэнд разработчик на Go в финтех стартапе Tabby ( Дубай), там же через год стал SRE и 1,5 года занимался внедрением SRE-культуры в компании, дежурил и руководил организацией дежурств, тренировками дежурных, управлял оповещением и реакцией на инциденты, организовал процесс работы с постмортемами, также начал внедрение SLO.

С октября 2023 года перешел в vitech.team (ИТ-компания выделена из Всеинструменты.ру в 2022), тут я занимаюсь вопросами внедрения SLO, стандартизацией работы с инфраструктурой (выработка единого подхода, чтобы разработчикам было проще работать с логами, метриками, распределённой трассировкой).

С чем помогу

Подскажу SRE или Senior разработчикам, продактам по вопросам внедрения SLO (с применением DataDog или sloth.dev), организации дежурств, организации реакции на инциденты (инструкции дежурным, тренировки, дежурство и резервный дежурный), написание постмортемов, отслеживание прогресса постмортемов.

Подскажу про переход из разработки в SRE.

Чем SRE отличается от DevOPS. Почему надежность это важно, и почему продукты должны отвечать с командой за нее как за фичу.

Как подготовиться к внедрению SLO, и как убедить разные стороны, что это нужно и выгодно всем (разработчикам, devops, продактам, руководству).

Послушаю ваши истории.

Компетенции
Reliability, SLO, Observability, Распределенная трассировка, логи, метрики, DataDog, NewRelic, Vector.Dev (observability pipeline), Prometheus, VictoriaMetrics, Grafana, jsonnet, OpsGenie, AlertManager, Linux, Kubernetes, GCP, Git, Kanban, Scrum