Алгоритмы и структуры данных
Умеет оценивать сложность алгоритмов
Знает алгоритмы и структуры данных из стандартного курса
Знает оценку сложности структур из для стандартной библиотеки
Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС
Предельные теоремы и умение их применять проверка гипотез бутстреп A/B-тестыусловия сходимости variance reduction causal inference байесовская оптимизация графические модели гауссовские процессы ML
Понимает ML-алгоритмы, включая SOTA-методы, в своей области
Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее)
Выстраивает подход к прогнозированию понимает ограничения методов, прокси-метрик и необходимость использования новых знание SOTA в отдельных областях MLOps
Разово может зафиттить модель, по запросу проверить, жива ли она, обновить развернуть какое-либо необходимое ПО в кластере, версионирование моделей, данных мониторинг работы моделей, качества данных
Выстраивание инфраструктуры прогнозирования SQL
Простые запросы (select'ы/группировки и т.д.)
Пользуется git'ом
Пишет тесты
Разработка программного кода.
Участие в разработке ИИ продуктов отдела.
Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью
Разрабатывает архитектуру систем, использующих машинное обучение
Подготовка данных для моделирования (получение, очистка)
Расчет результатов АБ-тестов, дизайн АБ-тестов
Построение моделей машинного обучения
Разворачивание моделей и сервисов в контуре х5 (hadoop/k8s/airflow)
Написание запросов на SQL, оптимизация запросов (spark, в частности)
Предлагает идеи для улучшения модели/подхода
Предлагает прокси-метрики и функции потерь, связанные с бизнес-метриками
Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных.
Техническая реализация data-science решений на продуктах департамента.
Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных.
Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.