Форма обучения:
дистанционная
Стоимость самостоятельного обучения:
бесплатно
Доступ:
свободный
Документ об окончании:
 
Уровень:
Специалист
Длительность:
16:12:00
Студентов:
2135
Выпускников:
143
Качество курса:
4.86 | 4.86
Курс посвящен изучению современных методов анализа данных.
Рассматриваются дисперсионный анализ, регрессионный анализ, факторный анализ, методы непараметрического анализа данных.
 

План занятий

Занятие
Заголовок <<
Дата изучения
Лекция 1
1 час 20 минут
Проверка гипотез в однофакторном дисперсионном анализе: параметрический и непараметрический случаи
В лекции рассматривается параметрический дисперсионный анализ (ДА) - проверяется однородность пары выборок при отвержении гипотезы об однородности всех K выборок. Определяется понятие контраста, строится доверительный интервал и проверяется гипотеза о равенстве контраста нулю. В случае непараметрического ДА подробно рассматривается использование критериев Краскела-Уоллиса и Джонкхиера для проверки гипотезы об отсутствии влияния фактора на результат.
Оглавление
-
Лекция 2
1 час 22 минуты
Двухфакторный дисперсионный анализ (ДА)
В лекции продолжает рассматриваться однофакторный ДА - приводятся непараметрические оценки Ходжеса-Лемана и Спетволля для параметра сдвига. На основе асимптотической относительной эффективности (АОЭ) делается сравнение критерия Краскела-Уоллиса с классическим. Основная часть лекция посвящена двухфакторному ДА: постановке задачи, описанию простейшей таблицы двухфакторного ДА. Подробно рассматривается вопрос проверки гипотезы об отсутствии влияния главного фактора на результат в параметрическом и непараметрическом случаях (критерии Фридмана и Пейджа). На основе АОЭ делается сравнение критерия Фридмана с классическим.
Оглавление
-
Лекция 3
1 час 25 минут
Исследование зависимостей между номинальными признаками
В лекции дается понятие шкалы измерения, описыватся наиболее распространенные шкалы. Вводится понятие таблицы сопряженности, подробно рассматривается проверка гипотез о независимости номинальных признаков. Вводятся меры связанности для таблиц сопряженности 2х2: коэффициенты контингенции и ассоциации Юла.
-
Лекция 4
1 час 23 минуты
Меры связи номинальных признаков в таблицах сопряженности произвольного размера
В лекции рассматриваются показатели, позволяющие оценить силу связи номинальных признаков: основанные на статистике хи-квадрат (коэффициенты среднеквадратической сопряженности, взаимной сопряженности Пирсона, Крамера) и основанные на прогнозе (меры прогноза Гутмана и Краскела-Гудмана). Приводятся примеры.
-
Лекция 5
1 час 25 минут
Анализ статистической связи между парой порядковых переменных
В лекции вводятся два коэффициента, позволяющие оценить силу связи между двумя порядковыми переменными: коэффициент ранговой корреляции Спирмена и коэффициент корреляции ранжировок Кендэла. Проводится сравнительный анализ критериев, определяется сфера их применения. Описывается проверка гипотез о равенстве коэффициентов нулю. Приводятся примеры.
-
Лекция 6
1 час 32 минуты
Анализ статистической связи между несколькими порядковыми переменными
В лекции описывается построение коэффициента, позволяющего оценить согласованность более, чем двух ранжировок, - коэффициента конкордации Кендэла. Указываются свойства коэффициента конкордации, схема проверки гипотезы о равенстве его нулю. Начинают рассматриваться вопросы изучения связи пары количественных переменных в случае их гауссовского распределения: дается определение независимости признаков, схема проверки гипотезы о независимости, построение доверительного интервала для коэффициента парной корреляции.
Оглавление
-
Лекция 7
1 час 27 минут
Исследование зависимостей между парой количественных признаков
В лекции описывается исследование связи двух количественных негауссовских признаков в случае их нелинейной связи на основе статистики хи-квадрат. Основная часть лекции посвящена такому показателю связи количественных признаков, как корреляционное отношение: определение, свойства, оценивание.
Оглавление
-
Лекция 8
1 час 15 минут
Анализ множественных связей в количественной шкале
В лекции дается определение частных, множественных коэффициентов корреляции, коэффициента множественной детерминации, описываются их свойства, схема проверки гипотез о равенстве нулю. Ставится задача построения функции регрессии, кратко описываются методы оценивания параметров регрессии (метод наименьших квадратов(МНК), взвешенный МНК, метод наименьших модулей).
-
Лекция 10
1 час 17 минут
Исследование регрессионных моделей
Описывается вся схема исследования построенной регрессионной модели при справедливости предположения о гауссовости погрешностей. Рассматривается проблема мультиколлинеарности в регрессионных моделях: от выявления мультиколлинеарности до ее устранения с применением метода главных компонент.
-
Лекция 11
1 час 15 минут
Факторный анализ
Лекция посвящена описанию одного из метода снижения размерности признакового пространства - факторного анализа. Рассматриваются алгоритмы метода главных компонент, метода главных факторов и метода максимального правдоподобия. Обосновывается необходимость и указываются предпосылки сжатия данных. Приводятся примеры.
-
1 час 40 минут
-
Елена Горбатенко
Елена Горбатенко

Прохожу курс статистический анализ данных. Видео к лекции 5 не доступно? Что сделать чтобы просмотреть эту лекцию и закончить курс?

Анна Коденко
Анна Коденко

в курсе анализ данных 11 лекция должна быть посвящена факторному анализу. А по факту лекция копирует 8 (если не ошибаюсь): анализ количественных связей. Вопрос: где 11 лекция?

Дмитрий Харламов
Дмитрий Харламов
Россия, Москва
Елена Волкова
Елена Волкова
Россия, Москва