Главная / Курсы / Data Science

DataOps-инженер

Курс предназначен для тех, кто уже знает, как строятся базы данных и работает ETL-процесс, кто уже прошёл путь первичных построений и нуждается в расширенных методах обработки потоковых данных и хранения огромных массивов

Формат

Лекции в записи

Начало обучения

20 апреля

Продолжительность курса

11 месяцев

Где проходит обучение

На собственной платформе

Уровень сложности

Новичок

Этот курс включает

Видеоуроки в записи, Вебинары, Видеоуроки в записи, Видеоуроки в записи, Видеоуроки в записи

Чему вы научитесь?

Предобрабатывать данные с помощью Python. Освоите синтаксис и библиотеки универсального инструмента аналитики, заложите фундамент для ML-изысканий ,Выстраивать инфраструктуру для больших данных. Сможете подбирать решения в зависимости от задач и особенностей бизнеса,Писать приложения на Kafka Streams DSL. Настроите приложение, в котором алерт-сообщения будут отправляться при заданных условиях,Использовать в работе Spark SQL. Получите практические навыки работы с DataFrame API,Работать с данными в облаке. Научитесь строить пайплайн, оптимизировать расходы и обеспечивать безопасность в облачной среде,Внедрять принципы гибкого подхода MLOps. Узнаете о философии CI\CD, пройдёте путь тестирования, продакшена и автоматического обучения ML-моделей

О курсе

Курс предназначен для тех, кто уже знает, как строятся базы данных и работает ETL-процесс, кто уже прошёл путь первичных построений и нуждается в расширенных методах обработки потоковых данных и хранения огромных массивов

Программа обучения

Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Научитесь получать и очищать данные, находить связи и проверять гипотезы. Сможете работать с главными аналитическими библиотеками.
Data Lake & Hadoop
Познакомитесь с основным инструментом обработки больших данных. Разберётесь в возможностях управления ресурсами кластера.
Продвинутые методы работы с данными
Изучите способы обработки разных видов данных. Узнаете, что такое оркестратор и какие задачи он решает. Поймёте, как эффективно преобразовывать данные в хранилищах.
Работа с потоковыми данными
Поймёте особенности работы с потоковыми данными. Разберётесь в логике работы брокеров сообщений.
Работа с данными в облаке
Познакомитесь с основными облачными провайдерами. Поймёте преимущества использования облачного хранилища. Выполните практические упражнения в облачной среде Yandex Cloud.
Введение в DS & ML
Познакомитесь с основными задачами машинного обучения. Научитесь работать с очисткой данных. Поймёте, как при помощи обученных моделей решать задачи. 
MLOps
Узнаете, зачем нужен DevOps. Разберётесь в пайплайне разработки ML-моделей. 
Английский для специалистов по работе с данными
Научитесь разбираться в аналитических терминах и читать иностранную техническую документацию. Сможете презентовать результаты анализа с помощью графиков и диаграмм на английском языке. Узнаете, как эффективно готовиться к собеседованиям в зарубежные компании. Научитесь составлять убедительное резюме и писать сопроводительное письмо.
Дипломный проект
В дипломной работе вы самостоятельно с поддержкой ментора обработаете данные, сформируете нормализованную схему данных, опишите ETL-процессы для заливки данных и создания витрин. Сформируйте набор метрик и дашбордов на их основе.
Карьерное планирование
Научитесь составлять резюме для новой профессии, писать сопроводительные письма и уверенно проходить собеседования.