Big Data engineer, в основном использую Python, Spark, Hadoop и Airflow. Я могу помочь оптимизировать процессы ETL, повысить эффективность обработки данных и внедрить надежные решения для мониторинга. Будь то настройка конвейеров CI/CD, работа с различными базами данных, такими как Clickhouse и Hive, или оптимизация существующих рабочих процессов обработки данных, у меня есть опыт достижения ощутимых улучшений в скорости обработки данных и обеспечении качества.
Разработка и оптимизация процессов ETL
Работа с технологиями обработки больших данных (Spark, Hadoop, Airflow)
Программирование на Python, Scala и SQL
Настройка и улучшение конвейеров CI/CD
Внедрение систем мониторинга данных
Оптимизация производительности обработки данных
Работа с различными базами данных (Clickhouse, Hive)
Обеспечение качества данных и создание соответствующих инструментов