На данный момент я работаю Senior ML Engineer/Data Scientist в OK.RU, где занимаюсь разработкой и внедрением рекомендательных систем. Здесь я применяю свои глубокие знания Python, Scala и Java, а также активно использую технологии Apache Spark, Kubernetes и Docker для обработки и анализа больших данных. Моя роль включает в себя настройку и оптимизацию инфраструктуры для машинного обучения, автоматизацию рабочих процессов с помощью Airflow и настройку потоковой обработки данных с Apache Kafka. Я также занимаюсь созданием CI/CD пайплайнов для ML-проектов, что обеспечивает непрерывную интеграцию и доставку.
До этого я работа в GPM-Data
Там я занимал позицию Middle Data Scientist / ML Enginee. В этой роли я разрабатывал и внедрял модели машинного обучения для анализа и персонализации медиаконтента. Я активно использовал Python и Spark для обработки больших объемов данных, создавая системы, которые улучшали пользовательский опыт. Мои обязанности включали настройку и оптимизацию инфраструктуры данных, а также сотрудничество с различными командами для интеграции моделей в производственные системы. Кроме того, я участвовал в проведении код-ревью и наставничестве, помогая развивать навыки коллег.
1. Обучение и наставничество в области машинного обучения и data science
• Объяснение основ и продвинутых тем ML: Помогу начинающим понять базовые концепции машинного обучения, такие как регрессия, классификация, кластеризация, а также более продвинутые методы, такие как глубокое обучение и обработка естественного языка.
• Рекомендательные системы: Поделюсь опытом в построении и оптимизации рекомендательных систем, включая работу с различными алгоритмами и методами оценки качества рекомендаций.
2. Программирование и разработка
• Python, Scala, Java: Обучу лучшим практикам написания кода, помогу освоить эти языки программирования, а также работать с различными библиотеками и фреймворками.
• Big Data и Spark: Помогу работать с большими данными, использовать Apache Spark для распределенной обработки данных, оптимизировать производительность и писать эффективные Spark-программы.
3. Инфраструктура и DevOps
• CI/CD: Обучу настройке и использованию непрерывной интеграции и доставки, автоматизации тестирования и развертывания.
• Kubernetes и Docker: Помогу контейнеризировать приложения, оркестровать контейнеры с помощью Kubernetes, развертывать и управлять микросервисами.
• Airflow: Настрою и обучу использованию Apache Airflow для планирования, мониторинга и управления рабочими процессами данных.
• Kafka: Обучу использованию Apache Kafka для потоковой обработки данных, настройке, администрированию и оптимизации производительности.
4. Карьерное развитие
• Руководство по карьерному росту: Помогу составить план карьерного развития, дам советы по переходу на более высокие позиции, рекомендации по улучшению навыков.
• Подготовка к интервью: Подготовлю к техническим и поведенческим интервью, разберу типичные вопросы и задачи, помогу составить резюме и сопроводительное письмо.
5. Проектная работа и практическое обучение
• Работа над реальными проектами: Наставлю в реализации реальных проектов, начиная от сбора и анализа данных до развертывания модели в продакшн.
• Код-ревью и рефакторинг: Проведу ревизию кода, дам рекомендации по улучшению кода, обучу принципам чистого кода и рефакторинга.
Примеры задач для менторства:
• Помогу новичкам освоить Spark и применить его для анализа больших данных.
• Настрою CI/CD для проектов машинного обучения с использованием Docker и Kubernetes.
• Разработаю и внедрю рекомендательную систему для проекта.
• Обучу использованию Airflow для автоматизации рабочих процессов.