Однофакторный дисперсионный анализ
Дисперсионный анализ представляет собой систему понятий и технических приемов, позволяющих обобщить процедуру сравнения двух средних для двух выборок, взятых из генеральных совокупностей с нормальным распределением, на случай большого числа выборок.
- провести однофакторный дисперсионный анализ;
- ответить на вопрос — совпадают или нет средние значения экспериментов;
- при выбранном уровне значимости подтвердить или опровергнуть нулевую гипотезу H0 о равенстве групповых средних;
Инструкция . Укажите число измерений (количество строк) q , количество уровней фактора p нажмите Далее . Полученное решение сохраняется в файле Word . Данная процедура обычно используется для отбора значимых факторов для построения множественного уравнения регрессии.
а для получения несмещенной общей выборочной дисперсии это выражение нужно умножить на pq/(pq-1):
Соответственно, для несмещенной факторной выборочной дисперсии:
где p-1 — число степеней свободы несмещенной факторной выборочной дисперсии.
С целью оценки влияния фактора на изменения рассматриваемого параметра рассчитывается величина:
Так как отношение двух выборочных дисперсий S 2 ф и S 2 ост распределено по закону Фишера-Снедекора, то полученное значение fнабл сравнивают со значением функции распределения
в критической точке fкр, соответствующей выбранному уровню значимости a.
Если fнабл>fкр, то фактор оказывает существенное воздействие и его следует учитывать, в противном случае он оказывает незначительное влияние, которым можно пренебречь.
Для расчета Rнабл и Rф могут быть использованы также формулы:
(4)
Находим общую среднюю по формуле (1):
Для расчета Rобщ по формуле (4) составляем таблицу 2 квадратов вариант:
| N | П 2 1 | П 2 2 | П 2 3 | П 2 4 |
| 1 | 21025 | 44100 | 38025 | 24025 |
| 2 | 19600 | 40000 | 36100 | 22500 |
| 3 | 22500 | 36100 | 57600 | 32400 |
| 4 | 36100 | 38025 | 44100 | 30625 |
| ∑ | 99225 | 158225 | 175825 | 109550 |
Общая средняя вычисляется по формуле (1):
Rобщ = 99225 + 158225 + 175825 + 109550 — 4 • 4 • 182.19 2 = 11748.44
Находим Rф по формуле (5):
Rф = 4(156.25 2 + 198.75 2 + 208.75 2 + 165 2 ) — 4 • 182.19 2 = 7792.19
Получаем Rост: Rост = Rобщ — Rф = 11748.44 — 7792.19 = 3956.25
Определяем факторную и остаточную дисперсии:
Для уровня значимости α=0.05, чисел степеней свободы 3 и 12 находим fкр из таблицы распределения Фишера-Снедекора.
fкр(0.05; 3; 12) = 3.49
В связи с тем, что fнабл > fкр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов принимаем.
а для получения несмещенной общей выборочной дисперсии это выражение нужно умножить на pq/(pq-1):
Соответственно, для несмещенной факторной выборочной дисперсии:
где p-1 — число степеней свободы несмещенной факторной выборочной дисперсии.
С целью оценки влияния фактора на изменения рассматриваемого параметра рассчитывается величина:
Так как отношение двух выборочных дисперсий S 2 ф и S 2 ост распределено по закону Фишера-Снедекора, то полученное значение fнабл сравнивают со значением функции распределения
Rобщ = 1322 + 1613 — 5 • 2 • 16.3 2 = 278.1
Находим Rф по формуле (5):
Rф = 5(15.6 2 + 17 2 ) — 2 • 16.3 2 = 4.9
Получаем Rост: Rост = Rобщ — Rф = 278.1 — 4.9 = 273.2
Определяем факторную и остаточную дисперсии:
Для уровня значимости α=0.05, чисел степеней свободы 1 и 8 находим fкр из таблицы распределения Фишера-Снедекора.
fкр(0.05; 1; 
В связи с тем, что fнабл < fкр, нулевую гипотезу о существенном влиянии фактора на результаты экспериментов отклоняем.
Другим словами, распределение вербальных и невербальных предпочтений студентов различаются.
Задание. На заводе установлено четыре линии по выпуску облицовочной плитки. С каждой линии случайным образом в течение смены отобрано по 10 плиток и сделаны замеры их толщины (мм). Отклонения от номинального размера приведены в таблице. Требуется на уровне значимости a = 0,05 установить наличие зависимости выпуска качественных плиток от линии выпуска (фактор A).
Задание. На уровне значимости a = 0,05 исследовать влияние цвета краски на срок службы покрытия.
Пример №1 . Произведено 13 испытаний, из них – 4 на первом уровне фактора, 4 – на втором, 3 – на третьем и 2 на четвертом. Методом дисперсионного анализа при уровне значимости 0,05 проверить нулевую гипотезу о равенстве групповых средних. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями. Результаты испытаний приведены в таблице.
Пример №2 . В школе 5 шестых классов. Психологу ставится задача, определить, одинаковый ли средний уровень ситуативной тревожности в классах. Для этого были приведены в таблице. Проверить уровень значимости α=0.05 предположение, что средняя ситуативная тревожность в классах не различается.
Пример №3 . Для изучения величины X произведено 4 испытания на каждом из пяти уровней фактора F. Результаты испытаний приведены в таблице. Выяснить, существенно ли влияние фактора F на величину X. Принять α = 0.05. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.
[expert_bq id=»1570″]вероятность отклонения нормально распределенной величины от математического ожидания более чем на 3σ практически равна нулю. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] Показатели вариации.Абсолютные показатели вариации.
Размах вариации — разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax — Xmin
R = 11 — (-5) = 16
Дисперсия — характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Определение и проверка нулевой гипотезы в статистике
После того как данные будут собраны, значения из выборки подставляют в формулу для вычисления статистики критерия (примеры различных статистик критериев см. ниже). Эта величина количественно отражает аргументы в наборе данных против нулевой гипотезы.
Находим общую среднюю по формуле (1):
Для расчета Rобщ по формуле (4) составляем таблицу 2 квадратов вариант:
| N | П 2 1 | П 2 2 | П 2 3 | П 2 4 |
| 1 | 21025 | 44100 | 38025 | 24025 |
| 2 | 19600 | 40000 | 36100 | 22500 |
| 3 | 22500 | 36100 | 57600 | 32400 |
| 4 | 36100 | 38025 | 44100 | 30625 |
| ∑ | 99225 | 158225 | 175825 | 109550 |
Общая средняя вычисляется по формуле (1):
Подобные документы
Математическое ожидание случайной величины. Свойства математического ожидания, дисперсия случайной величины, их суммы. Функция от случайных величин, ее математическое ожидание. Коэффициент корреляции, виды сходимости последовательности случайных величин.
Дискретные системы двух случайных величин. Композиция законов распределения, входящих в систему. Определение вероятности попадания случайной величины в интервал; числовые характеристики функции; математическое ожидание и дисперсия случайной величины.
контрольная работа [705,1 K], добавлен 22.11.2013
Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.
контрольная работа [165,5 K], добавлен 03.01.2012
События и случайные величины. Функция распределения и ее характерные свойства. Сущность и определение основных числовых характеристик случайных величин: математическое ожидание, дисперсия, моменты. Критерии и факторы, влияющие на их формирование.
контрольная работа [118,5 K], добавлен 30.01.2015
Критерий Пирсона, формулировка альтернативной гипотезы о распределении случайной величины. Нахождение теоретических частот и критического значения. Отбрасывание аномальных результатов измерений при помощи распределения. Односторонний критерий Фишера.
[expert_bq id=»1570″]начальный курс математики одинаково усваивается как детьми, которые начали обучение в шестилетнем возрасте, так и детьми, начавшими обучение с 7 лет. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] Со временем вы обнаружите, что отклонение от истинных 50/50 подчиняются некому закону. Минимальные отклонения встречаются часто, а значительные (например, 35 выпадений решки и 65 орла) крайне редко!Проверка гипотез
Основная задача анализа вариационных рядов – это выявление подлинной закономерности распределения, которая достигается увеличением объема исследуемой совокупности при одновременном уменьшении интервала ряда.
