Описание:
Можно совмещать с основной работой (от 10 часов в неделю) Привет! На связи команда из направления анализа данных Яндекс Практикума. Мы готовим курс "Специалист по Data Science" и ищем авторов, которые поделятся своей экспертизой. Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию и найти стабильную работу. А технологии и команда экспертов помогают довести дело до конца. Что делает автор: Создает материалы для новых курсов в команде с другими авторами, методистами, редакторами, иллюстраторами и продактами программы. Пишет тексты уроков, в которых поддерживает интерес студентов к обучению. Улучшает существующий контент на основе обратной связи от студентов, экспертов сопровождения и редакторов. Разрабатывает дополнительные материалы (тренажёр, чек-листы, тесты, памятки, квизы) и тестовые задания для проверки знаний. Предлагает идеи, как улучшить усвоение материала. Участвует в проектировании программы Что вам понадобится для работы над курсом: В рамках базовой программы "Специалист Data Science" мы разрабатываем уроки для следующих модулей: 1. Основы машинного обучения. Линейные модели (Знакомство с МО. Первая модель - Линейная регрессия, Логистическая регрессия, Метод опорных векторов (SVM)) 2. Обучение моделей. Модели на основе деревьев и обучение без учителя (Решающее дерево, Random forest, Boosting and gradient boosting, Обучение без учителя) 3. Внедрение, мониторинг, AB-тесты моделей (Внедрение и мониторинг моделей, Формулировка гипотез, Анализируем результаты А/В тестирования с помощью Python, Подготовка к собеседованиям) А в рамках расширенной версии программы мы разрабатываем уроки для учебных спринтов: Обработка больших данных, Трекинг экспериментов в ML flow, Введение в глубинное обучение. Нейронные сети для изображений, Нейронные сети для текстов, Рекомендательные системы. Авторы должны глубоко понимать одну или несколько тем, которые мы включили в программу (достаточна экспертиза в конкретной теме/инструменте из списка). Для этого необходим опыт работы со следующими инструментами: 1. Scikit-learn. Ожидаем, что ты активно используешь библиотеку для решения практических задач машинного обучения. Важно уверенно обучать и валидировать различные модели машинного обучения, выполнять предобработку данных, а также проводить отбор признаков и настройку гиперпараметров моделей. 2. XGBoost/LightGBM/CatBoost. Ожидаем, что ты знаком с особенностями каждой библиотеки, умеешь эффективно настраивать гиперпараметры с помощью Optuna, а также проводить интерпретацию моделей с помощью feature importance, permutation importance и SHAP для решения реальных задач. 3. Pandas и NumPy. Важно иметь опыт работы с табличными данными, уверенно использовать pandas для очистки и обработки данных, а также применять NumPy для векторизации вычислений. 4. MLflow. Здорово, если ты имеешь опыт трекинга экспериментов, логирования параметров, метрик и моделей с помощь