Открываем 70+ курсов на неделю за 1 ₽Узнать больше
Партнёры Академика Pro
ProProВсе материалы курса доступны по подписке Академика Pro
  • Для всех
  • С сертификатом
  • На русском языке
  • 72 часа
  • 3 400
Условия подписки

Анализ данных на практике

Хотите научиться анализу данных и стать профессионалом? Присоединяйтесь к курсу от эксперта в области Big Data! Узнаете об основных способах машинного обучения и поработаете над реальными задачами — классифицируете музыкальные жанры и спрогнозируете отток пользователей.

  • Для всех
  • С сертификатом
  • На русском языке
  • 72 часа
  • 3 400
Условия подписки
Посмотреть программу

Чему вы научитесь

  • Решать задачи классификации, регрессии, кластеризации

  • Оценивать качество алгоритмов, преобразования признаков

  • Решать реальные задачи анализа данных

  • Прогнозировать временные ряды

Содержание курса

  • 1 курс
  • 12 модулей
  • 12 тем
  • 72 часа
  • Введение
    • Вводные слова о машинном обучении.
    • Простейшие примеры применения машинного обучения.
    • Оценка качества алгоритма.
    • Примеры из жизни.
    • Задача классификации.
    • Байесовский классификатор.
    • Задачи кластеризации и регрессии.
    • Наиболее часто используемые методы.
    • Качество и признаки.
    • Переобучение и недообучение.
    • Инструменты.
  • Метрики качества. Работа с признаками, постановка задач
    • Accuracy, precision, recall.
    • ROC-AUC.
    • Метрики качества в задачах регрессии.
    • Оптимизация метрик.
    • Работа с признаками.
    • Генерация признаков.
    • Отбор признаков.
    • Преобразование признаков.
    • PCA: подробности.
    • Пример: рекомендации товаров.
  • Решающие деревья в задачах классификации и регрессии
    • Решающие деревья.
    • Как строить решающие деревья.
    • Ансамбли деревьев.
    • Линейные модели.
    • Пример: классификация музыки по жанрам.
    • Решающие деревья: дополнительные темы.
  • Построение ансамблей. Random Forest и Gradient Forest
    • Обзор методов построения композиций.
    • Бустинг.
    • Усреднение моделей.
    • Леса решающих деревьев.
    • Градиентный бустинг над деревьями.
    • Сравнения композиций алгоритмов.
    • Ансамбли деревьев: дополнительные темы.
    • Смещение и разброс.
    • Разброс усреднённой модели.
    • XGBoost.

Автор курса

  • Виктор Кантор

    Виктор Кантор

    Старший преподаватель ФИВТ МФТИ

Сертификат от МФТИ Физтех

Подтвердит, что вы прошли курс, и усилит ваше портфолио или резюме.