Алексей Захаров

Тимлид @ Т-Банк
Сети
Team Lead/Management
DevOps/SRE
System Design
Алексей Захаров
Опыт: 10+ лет
Цена (за час): 5000 руб
О себе

10+ лет в инфраструктуре. Прошел путь от сисадмина в провайдере до техлида сложных проектов инфры в т-банке.

Несколько лет в облаке Selectel: железо, ядро linux, сети, ceph. Прошел через всё, что бывает в проде на масштабе — баги в железе, крупные сбои, ночные разборы. Научился системно работать с критичными сервисами и не паниковать, когда всё горит.

Полностью переделал мониторинг отдела: zabbix -> collectd -> prometheus/victoriametrics. Команда получила нормальную обсервабилити, MTTR на инцидентах резко упал.

Дальше — SRE в тинькофф voicekit, потом лид этой же команды. Строили надежность продукта с нуля: SLO/SLI, внятный SLA для клиентов, обсервабилити, on-call процессы.

Потом — лид команды распределенного фаервола в т-банке. Стек: ebpf, golang, k8s.

Сейчас — техлид и технический проектный менеджер проекта SRv6 для cilium. Параллельно выстраиваю системную работу над производительностью: чтобы перф был частью процесса.

Еще один трек — веду проект на вайбкодинге. Полноценный MVP с бэком, фронтом и андроид-приложением. Уже есть первые платящие подписчики. На себе проверил, где AI-тулы дают x5-x10 в скорости разработки и как удерживать при этом качество продукта.

С чем помогу

Linux performance и дебаг

  • разобрать проблему с производительностью: как искать первопричину, а не симптом

  • перф-аудит сервиса: что мерить, чем мерить, как интерпретировать

  • ядро linux: как туда подойти, что читать, как дебажить

  • ebpf: где реально полезен, где переоценен, как притащить в прод

Обсервабилити и SRE-практики

  • построение мониторинга с нуля или миграция со старого (prometheus, victoriametrics)

  • SLO/SLI как рабочий инструмент, а не отписка для отчёта

  • post-mortem-культура и работа с инцидентами на критичных системах

Вайбкодинг и AI-ассистенты в разработке

  • как использовать AI-тулы

  • где они дают скорость, а где приводят в технический долг

  • как организовать процесс, чтобы AI-код был поддерживаемым

  • разбор проекта или процесса: что можно ускорить, что лучше делать руками

  • пилю свой продукт через AI-тулы — расскажу, что реально работает

Работа тимлида/SRE-лида

  • переход из инженера в лида: что меняется, как не сгореть

  • найм инженеров разного уровня

  • капасити-планирование, конфликты

Формат

Опиши задачу и ожидаемый результат — отвечу, чем смогу помочь. Если ок — созваниваемся и работаем по твоему кейсу.

Компетенции
техлидинг, тимлидинг, проектное управление, вайбкодинг, MVP, ebpf, cilium, srv6, network performance, performance, linux, ceph, sre, slo/sli, инциденты, post-mortem, on-call, observability, victoriametrics, prometheus