Февральские скидки до 70%6 дней 19:15:10Выбрать курс
Партнёры
  • Для всех
  • С сертификатом
  • На русском языке
  • 10 часов
  • 5 700

Сравнение и создание групп

Научитесь сравнивать группы, находить и анализировать различия между категориями и освойте алгоритмы кластеризации. В конце курса выполните исследовательский проект на реальных данных компании «2ГИС». Этот курс — часть программы «Анализ данных» от НГУ.

  • Для всех
  • С сертификатом
  • На русском языке
  • 10 часов
  • 5 700
Посмотреть программу

Чему вы научитесь

  • Проверять статистические гипотезы

  • Анализировать различия между категориями

  • Выявлять группы и структуры в данных

  • Применять алгоритмы кластерного анализа

  • Отличать случайности от закономерностей

  • Решать задачи сравнения и создания групп в SPSS и R

Трейлер курса

Содержание курса

Каждый модуль посвящён отдельному классу задач и завершается тестом для самопроверки. В конце вы пройдёте тестирование и выполните практическое задание на данных компании «2ГИС».

  • 5 модулей
  • 5 тем
  • 10 часов
  • Введение: структура и содержание курса

    Узнаете, как устроен курс, и познакомитесь с данными, с которыми будете работать.

  • Одновыборочные и двухвыборочные критерии

    В первом модуле курса мы начнём разбираться со статистическими инструментами сравнения параметров и распределений в группах. Вы узнаете об основных задачах межгрупповых сравнений и рассмотрите одновыборочные и двухвыборочные критерии. Научитесь сравнивать связанные и несвязанные выборки, рассчитаете основные статистики в R и SPSS на основе реальных данных и интерпретируете полученные результаты.

    • Введение в межгрупповые сравнения.
    • Одновыборочные критерии сравнения средних.
    • Сравнение двух независимых выборок.
    • Сравнение дисперсий двух независимых выборок.
    • Сравнение распределений двух независимых выборок.
    • Сравнение двух связанных выборок.
    • Критерии равенства групп. Практика.
    • Сравнение средних в SPSS. Практика.
  • Сравнение нескольких выборок

    Научитесь сравнивать несколько групп при помощи разных инструментов, выбирать инструменты исходя из задачи и типа данных. На практике узнаете, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты

    • Сравнение средних для k независимых выборок: параметрический случай.
    • Сравнение средних для k независимых выборок: непараметрический случай.
    • Сравнение средних для нескольких связанных выборок.
    • Критерий Фридмана.
    • Биномиальные данные.
    • Проверка соответствия выборочных пропорций теоретическим.
    • Проверка гипотез о равенстве средних для нескольких зависимых и независимых групп в R. Практика.
    • Сравнение средних в SPSS: k-выборочные критерии. Практика.
    • Сравнение средних в SPSS: тесты для связанных выборок. Практика.
  • Введение в кластерный анализ

    Вы научитесь находить в данных группы, о существовании которых вы пока не знаете. Узнаете, как их выделять, характеризовать, и познакомитесь с агломеративными методами классификации. Отточите навыки на реальных данных.

    • Особенности методов кластерного анализа.
    • Меры сходства. Меры расстояния.
    • Корреляционные меры сходства и меры ассоциативности.
    • Иерархический кластерный анализ.
    • Определение оптимального количества кластеров.
    • Иерархический кластерный анализ: пример.
    • Иерархический кластерный анализ в R. Практика.
    • Иерархический кластерный анализ в SPSS. Практика.

Спикеры

  • Ольга Ечевская

    Ольга Ечевская

    Социолог-исследователь, кандидат социологических наук, преподаватель курсов по анализу данных в НГУ
  • Наталья Галанова

    Наталья Галанова

    Аналитик данных компании 2GIS

Сертификат от НГУ

Подтвердит, что вы прошли курс, и усилит ваше портфолио или резюме.