Проверка Гипотезы о Равенстве Средних Двух Выборок в Excel
Глава 4. Статистический анализ числовых величин (непараметрическая статистика)
4.4. О проверке однородности двух независимых выборок
В математико-статистических терминах постановка задачи такова: имеются две выборки x1, x2. xm и y1, y2. yn (т. е. наборы из m и п действительных чисел), требуется проверить их однородность. Термин «однородность» уточняется ниже.
Противоположным понятием является «различие». Можно переформулировать задачу: требуется проверить, есть ли различие между выборками. Если различия нет, то для дальнейшего изучения часто выборки объединяют.
Традиционный метод проверки однородности (критерий Стьюдента). Для дальнейшего критического разбора опишем традиционный статистический метод проверки однородности. Вычисляют средние арифметические в каждой выборке
и статистику Стьюдента t, на основе которой принимают решение,
Рассмотрим условия применимости традиционного метода проверки однородности, основанного на использовании статистики t Стьюдента, а также укажем более современные методы.
Возможность применения модели в конкретной реальной ситуации требует обоснования. Независимость и одинаковая распределенность результатов наблюдений, входящих в выборку, могут быть установлены или исходя из методики проведения конкретных наблюдений, или путем проверки статистических гипотез независимости и одинаковой распределенности с помощью соответствующих критериев [8].
При дальнейшем изложении принимаем описанную выше вероятностную модель двух выборок.
Уточнения понятия однородности. Понятие «однородность», т. е. «отсутствие различия», может быть формализовано в терминах вероятностной модели различными способами.
Наивысшая степень однородности достигается, если обе выборки взяты из одной и той же генеральной совокупности, т. е. справедлива нулевая гипотеза
Отсутствие однородности означает, что верна альтернативная гипотеза, согласно которой
хотя бы при одном значении аргумента x0. Если гипотеза H0 принята, то выборки можно объединить в одну, если нет — то нельзя.
В некоторых случаях целесообразно проверять не совпадение функций распределения, а совпадение некоторых характеристик случайных величин Х и Y — математических ожиданий, медиан, дисперсий, коэффициентов вариации и др. Например, однородность математических ожиданий означает, что справедлива гипотеза
где M(Х) и M(Y) — математические ожидания случайных величин Х и Y, результаты наблюдений над которыми составляют первую и вторую выборки соответственно. Доказательство различия между выборками в рассматриваемом случае — это доказательство справедливости альтернативной гипотезы
Классические условия применимости критерия Стьюдента. Пусть выполнены два классических условия применимости критерия Стьюдента, основанного на использовании статистики t, заданной формулой (1):
а) результаты наблюдений имеют нормальные распределения:
F(x)=N(x; m1, s1 2 ), G(x)=N(x; m2, s2 2 )
с математическими ожиданиями m1 и m2 и дисперсиями s1 2 и s2 2 в первой и во второй выборках соответственно;
б) дисперсии результатов наблюдений в первой и второй выборках совпадают:
D(X)=s1 2 =D(Y)=s2 2 .
Если условия а) и б) выполнены, то нормальные распределения F(x) и G(x) отличаются только математическими ожиданиями, а поэтому обе гипотезы H0 и H’0 сводятся к гипотезе
а обе альтернативные гипотезы H1 и H’1 сводятся к гипотезе
Сформулированное в предыдущем абзаце утверждение справедливо для любых функций распределения F(x) и G(x) таких, что M(X)=M(Y), D(X)=D(Y) и выполнены некоторые внутриматематические условия, обычно считающиеся справедливыми в реальных задачах. Если же M(X)¹M(Y), то нетрудно вычислить, что при больших объемах выборок
Формулы (2) — (3) позволяют приближенно вычислять мощность t-критерия (точность возрастает при увеличении т и п).
Итак, в большинстве экономических и технико-экономических задач условие б) нельзя считать выполненным, а проверять его нецелесообразно.
Последствия нарушения условия равенства дисперсий. Если объемы выборок т и п велики, то можно показать, что распределение статистики t описывается с помощью только математических ожиданий M(Х) и M(Y), дисперсий D(X), D(Y) и отношения объемов выборок, а именно:
Критерий Крамера-Уэлча равенства математических ожиданий
Вместо критерия Стьюдента предлагаем для проверки H’0 использовать критерий Крамера-Уэлча [12], основанный на статистике
При т=п, как следует из формул (1) и (6), t=T. При т¹п этого равенства нет. В частности, при sx 2 в (1) стоит множитель (m-1), а в (6)- множитель п.
Если M(X)¹M(Y), то при больших объемах выборок
При т=п или D(X)=D(Y), согласно формулам (3) и (8), amn=cmn , в остальных случаях равенства нет.
Из асимптотической нормальности статистики Т, формул (7) и (8) следует, что правило принятия решения для критерия Крамера-Уэлча выглядит так:
— если |T|то гипотеза однородности (равенства) математических ожиданий принимается на уровне значимости
— если же |T|>то гипотеза однородности (равенства) математических ожиданий отклоняется на уровне значимости .
В эконометрике наиболее часто применяется уровень значимости Тогда значение модуля статистики Т Крамера-Уэлча надо сравнивать с граничным значением
Из сказанного выше следует, что применение критерия Крамера-Уэлча не менее обосновано, чем применение критерия Стьюдента. Дополнительное преимущество — не требуется равенства дисперсий D(X)=D(Y). Распределение статистики Т не является распределением Стьюдента, однако и распределение статистики t, как показано выше, не является таковым в реальных ситуациях.
Пример. Пусть объем первой выборки Для второй выборки Вычислим величину статистики Крамера-Уэлча
Поскольку полученное значение по абсолютной величине меньше 1,96, то гипотеза однородности математических ожиданий принимается на уровне значимости 0,05.
Каким из непараметрических критериев пользоваться? Как известно [10], для выбора одного из нескольких критериев необходимо сравнить их мощности, определяемые видом альтернативных гипотез. Сравнению мощностей критериев посвящена обширная литература.
Хорошо изучены свойства критериев при альтернативной гипотезе сдвига
Определяем значение t kp по таблице распределения Стьюдента
По таблице Стьюдента находим:
T табл (f;α/2) = T табл (15;0.025) = 2.131
По таблице критических точек распределения Стьюдента при уровне значимости α = 0.05 и данному числу степеней свободы находим t кр = 2.131
Т.к. t набл
Проверка гипотезы равенства средних двух выборок (t — критерий). Проверка гипотезы о равенстве двух генеральных средних
- Отсортируйте значения выборки по возрастанию (значения выборки x j будут отложены по горизонтальной оси Х);
- Каждому значению x jвыборки поставьте в соответствие значения (j-0,5)/n, где n – количество значений в выборке , j – порядковый номер значения от 1 до n. Этот массив будет содержать значения от 0,5/n до (n-0,5)/n. Таким образом, диапазон от 0 до 1 будет разбит на равномерные отрезки. Этот диапазон соответствует вероятности наблюдения значений случайной величины Zj ;
- Преобразуем значения массива, полученные на предыдущем шаге, с помощью обратной функциистандартного нормального распределения НОРМ.СТ.ОБР() и отложим их по вертикальной оси Y.
Возвращает F-распределение вероятности. Эту функцию можно использовать, чтобы определить, имеют ли два множества данных различные степени плотности. Например, можно исследовать результаты тестирования мужчин и женщин, окончивших высшую школу и определить отличается ли разброс результатов для мужчин и женщин.
t-КРИТЕРИЙ СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ СОВОКУПНОСТЕЙ
– общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Уильям Госсет
1. История разработки t-критерия
Данный критерий был разработан Уильямом Сили Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется t-критерий Стьюдента?
3. В каких случаях можно использовать t-критерий Стьюдента?
Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. Также имеет значение равенство дисперсий (распределения) сравниваемых групп (гомоскедастичность). При неравных дисперсиях применяется t-критерий в модификации Уэлча (Welch’s t).
При отсутствии нормального распределения сравниваемых выборок вместо t-критерия Стьюдента используются аналогичные методы непараметрической статистики, среди которых наиболее известными является U-критерий Манна — Уитни.
4. Как рассчитать t-критерий Стьюдента?
Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:
где М1 — средняя арифметическая первой сравниваемой совокупности (группы), М2 — средняя арифметическая второй сравниваемой совокупности (группы), m1 — средняя ошибка первой средней арифметической, m2 — средняя ошибка второй средней арифметической.
5. Как интерпретировать значение t-критерия Стьюдента?
Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n1 и n2). Находим число степеней свободы f по следующей формуле:
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже).
Сравниваем критическое и рассчитанное значения критерия:
- Если рассчитанное значение t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
- Если значение рассчитанного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.
6. Пример расчета t-критерия Стьюдента
Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:
После выполнения расчетов, значение t-критерия оказалось равным 4,51. Находим число степеней свободы как (34 + 40) — 2 = 72. Сравниваем полученное значение t-критерия Стьюдента 4,51 с критическим при р=0,05 значением, указанным в таблице: 1,993. Так как рассчитанное значение критерия больше критического, делаем вывод о том, что наблюдаемые различия статистически значимы (уровень значимости р<0,05).
[expert_bq id=»1570″]Для того, чтобы быть в большей степени уверенности в своих суждениях о верности или неверности гипотезы, предпочитают применять несколько критериев и сравнивать результаты. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] Вне зависимости от типа критерия для того, чтобы найти квантили функции распределения, которому подчиняется критерий, необходимо знать параметры этой функции (например, если критерий подчиняется нормальному закону, то его параметрами являются математическое ожидание и стандартное отклонение). Значение параметров оценивается на выборках.Методы статистики
В таком случае a называется квантилью функции распределения уровня b. Если левая и правые границы области — 1/4 и 3/4, то квантиль называется квартилью, если левая и правая границы области представляют собой дроби со знаменателем 10, то квантили называются децилями (понятия квартили, децилей, квинтилей и процентилей рассмотрены на уроке характеристики выборки и генеральной совокупности).
Проверка статистических гипотез: основные понятия и примеры
Статистические гипотезы: основные понятия. Шаги проверки гипотез
Статистическая гипотеза — это некоторое предположение о свойствах генеральной совокупности, которое необходимо проверить. Статистические гипотезы выдвигаются, когда необходимо проверить, является ли наблюдаемое явление элементом случайности или результатом воздействия некоторых мероприятий.
Например, необходимо выяснить, значительно ли отличается средний объём продаж после проведения рекламной кампании от среднего объёма продаж после проведения рекламной кампании. Если ответ на этот вопрос положителен, то можно сделать вывод о том, что изменения являются результатом рекламной кампании.
Выводы, полученные путём проверки статистических гипотез, носят вероятностный характер: они принимаются с некоторой вероятностью. Статистическая гипотеза может быть также предположением о свойствах двух совокупностей, если, например, в ходе мероприятий имело место воздействие только на одну совокупность и необходимо сделать вывод о том, было ли это воздействие результативным.
Шаги проверки статистических гипотез следующие:
- формулируется основная гипотеза H 0 и альтернативная гипотеза H 1 ;
- выбирается статистический критерий, с помощью которого будет проверяться гипотеза;
- задаётся значение уровня значимости α ;
- находятся границы области принятия гипотезы;
- делается вывод о принятии или отвержении основной гипотезы H 0 .
Рассмотрим эти шаги и связанные с ними понятия подробнее.
Статистические гипотезы: основная и альтернативная
Основная гипотеза H 0 — предположение о свойствах генеральной совокупности, которое является логичным и правдоподобным, но требует проверки. Основная гипотеза обладает «презумпцией невиновности», или точнее «презумпцией справедливости»: пока не доказано, что её утверждение ложно, она считается истинной.
Альтернативная гипотеза H 1 — утвержление о свойствах генеральной совокупности, которое принимается в случае, когда нет возможности принять основную гипотезу.
Приведём примеры того, как формулируются основная и альтернативная гипотезы.
Пример 1. До и после проведения рекламной кампании были собраны данные о среднем объём продаж.
Основная гипотеза H 0 : средний объём продаж до проведения рекламной кампании незначительно отличается от среднего объёма продаж после проведения рекламной кампании.
Альтернативная гипотеза H 1 : средний объём продаж изменился после проведения рекламной кампании.
Пример 2. После изменения конфигурации компьютерной сети были собраны случайным образом 200 замеров скорости передачи сообщений.
Основная гипотеза H 0 : изменение конфигурации не имело эффекта.
Альтернативная гипотеза H 1 : эффект от изменения статистически значим.
Статистические критерии для проверки гипотез
Статистический критерий — статистическая характеристика выборки, вычисляемая по некоторому математическому соотношению (формуле) на основе данных, имеющихся в выборке.
По значению этой характеристики принимается решение, принимать основную гипотезу или нет. Статистические критерии бывают двух видов:
- статистический критерий является случайной величиной, закон распределения которой известен. Зачастую в названии статистического критерия упоминается его закон распределения. Например, критерий хи-квадрат-Пирсона подчиняется закону распределения хи-квадрат;
- чем ближе значение статистического критерия к нулю, тем более вероятно, что основная гипотеза является верной.
Уровень значимости α, ошибки первого и второго рода
Уровень значимости α — это вероятность ошибки первого рода. Значение уровня значимости обычно достаточно малое и задаётся аналитиком, проверяющим гипотезу. Чаще всего принимает значения 0,01 (1%), 0,05 (5%) и 0,1 (10%).
При проверке гипотезы всегда существует вероятность того, что будет сделано ошибочное заключение. Существуют два рода ошибки.
Ошибка первого рода — отвержение основной гипотезы при том, что она верна.
Ошибка второго рода — принятие основной гипотезы при том, что она ложна.
Со значением уровня значимости связано значение уровня доверия p.
Уровень доверия p — вероятность принятия верной гипотезы. Помним: пока не доказано, что основная гипотеза H 0 является ложной, мы считаем её верной. Поэтому уровень значимости будет определять вероятность принятия основной гипотезы. Если уровень значимости α — вероятность отвержения верной гипотезы, то вероятность принятия верной гипотезы: p = 1 — α .
Пример 3. В лаборатории фармацевтического предприятия делается контрольный замер на соответствие контрольного состава лекарственных препаратов стандарту. Какие варианты гипотез могут быть предложены?
Основная гипотеза H 0 — лекарства соответствуют стандарту.
Альтернативная гипотеза H 1 — лекарства не соответствуют стандарту.
Основная гипотеза H 0 — лекарства не соответствуют стандарту.
Альтернативная гипотеза H 1 — лекарства соответствуют стандарту.
По причинам, которые мы выяснили в примере 3, статистические гипотезы часто формулируются следующим образом: «статистическая значимость между факторами незначима», «выборки незначимо отличаются по своим свойствам», «фактор не имеет значимого влияния на исследуемый процесс».
Нахождение границ области принятия гипотезы
Область принятия гипотезы (ОПГ) — подмножество таких значений критерия, при которых основная гипотеза не может быть отвергнута. Область принятия гипотезы всегда включает в себя значение 0.
Критическая область — подмножество таких значений критерия, при которых основная гипотеза не может быть принята.
В случае, если используется односторонний критерий, ОПГ включает в себя подмножество положительных значений критерия. В таком случае у критерия есть только одна критическая область.
В случае, если используется двусторонний критерий, который может принимать как положительные, так и отрицательные значения, у него имеются две критические области: подмножество отрицательных и подмножество положительных значений критерия, при которых гипотеза не может быть принята.
На этом шаге требуется найти такое подмножество значений критерия, к которому значение выбранного критерия будет принадлежать с вероятностью p. Точнее, необходимо найти крайние значения критерия в этом подмножестве.
Поэтому процедура нахождения границ области принятия гипотезы сводится к решению следующей задачи:
вероятность того, что значения критерия принадлежат области принятия гипотезы,
левое и правое критические значения области принятия гипотезы (критические точки).
То есть задача решается путём взятия обратной функции от прямой функции распределения.
Обратным значением функции распределения с аргументом b является такое значение случайной величины a, при котором выполняется следующее условие:
В таком случае a называется квантилью функции распределения уровня b. Если левая и правые границы области — 1/4 и 3/4, то квантиль называется квартилью, если левая и правая границы области представляют собой дроби со знаменателем 10, то квантили называются децилями (понятия квартили, децилей, квинтилей и процентилей рассмотрены на уроке характеристики выборки и генеральной совокупности).
В случае с односторонним критерием получаем следующую формулу для нахождения критической точки:
Вне зависимости от типа критерия для того, чтобы найти квантили функции распределения, которому подчиняется критерий, необходимо знать параметры этой функции (например, если критерий подчиняется нормальному закону, то его параметрами являются математическое ожидание и стандартное отклонение). Значение параметров оценивается на выборках.
Вывод о принятии или отвержении основной гипотезы
В случае, если значение критерия, найденное на выборочных значениях наблюдений принадлежит области принятия гипотезы, делается вывод о том, что нет возможности отвергнуть основную гипотезу.
В случае, если критерий принадлежит критической области, делается вывод о том, что нет возможности принять основную гипотезу. В таком случае принимается альтернативная гипотеза.
На рисунке ниже синим цветом изображена ось всевозможных значений критерия R, другие обозначения иллюстрируют попадание значения критерия в область принятия гипотезы или критическую область.
Для того, чтобы быть в большей степени уверенности в своих суждениях о верности или неверности гипотезы, предпочитают применять несколько критериев и сравнивать результаты. Если в нескольких случаях критерий не смог попасть в область принятия гипотезы, то говорят, что получили согласованный результат и скорее всего гипотеза является ложной.
Проверка гипотезы о среднем генеральной совокупности
Часто бывает необходимо проверить, значимо ли отличается средний показатель совокупности от некоторого заданного значения, например, стандарта. В этом случае основная и альтернативная гипотезы могут быть записаны так:
Нулевую гипотезу нет возможности отвергнуть с вероятностью P = 1 — α , если , где
— некоторое заданное среднее значение, например, стандарт,
Пример 4. Производитель кваса решил выяснить, работает ли устройство заполнения бутылок соответственно стандарту. Основная и альтернативные гипотезы сформулированы так:
Для проверки случайным образом выбрали 20 бутылок, средний незаполненный уровень составил мм, стандартное отклонение мм.
Так как выборка очень мала (20 единиц) и не известно стандартное отклонение генеральной совокупности, то выбран уровень доверия p = 95% .
Получаем фактическое значение статистического критерия:
Так как , то есть фактическое значение статистического критерия меньше критического значения, то фактическое значение попадает в область принятия гипотезы. Следовательно, нет возможности отвергнуть основную гипотезу о том, что средний уровень незаполненности бутылки незначимо отличается от 50 мм.
В исследованиях нередки случаи необходимости сравнения средних в группах, одну из которых можно назвать «нормальной», а другую — далекой от «нормы», то есть нужно провести сравнение двух групп.
Проверка гипотезы о виде закона распределения выборки
Цель проверки гипотезы о виде закона распределения выборки — подобрать к распределению выборки известное теоретическое распределение и сделать вывод о распределении всей генеральной совокупности.
Статистические гипотезы для этой проверки формулируются следующим образом.
Основная гипотеза H 0 : распределение выборки незначимо отличается от предполагаемого (нормальное, экспоненциальное и др.).
Альтернативная гипотеза H 1 : распределение выборки значимо отличается от предполагаемого.
Критерий согласия показывает степень отличия эмпирической функции распределения (то есть значения, полученного из выборки) от гипотетической (теоретической, то есть предполагаемой до наблюдения). Чем меньше значение критерия, тем больше степень похожести эмпирического и теоретического распределений.
Применяются критерий хи-квадрат Пирсона и критерий Колмогорова-Смирнова. Однако существуют ограничения этих критериев. Для критерия хи-квадрат: в каждом интервале должно быть не менее 10 наблюдений. Для критерия Колмогорова-Смирнова: объём выборки должен быть более 50.
Формула оценки значения критерия хи-квадрат Пирсона:
Число степений свободы df — число независимых элементов информации, используемых для вычисления стандартной ошибки.
Значение критерия Колмогорова-Смирнова рассчитывается следующим образом:
Даже при проверке статистической гипотезы на компьютере область принятия гипотезы в этом случае нужно рассчитывать самостоятельно.
Пример 5. Имеются данные некоторой выборки. Используя критерии хи-квадрат и Колмогорова-Смирнова, при уровне значимости α=0,05 проверить гипотезы о
критерий хи-квадрат: 2,72 (число степеней свободы: 4; границы ОПГ: (0; 5,99));
критерий Колмогорова-Смирнова: 0,08 (границы ОПГ: (0; 0,18)).
Вывод относительно проверяемой гипотезы: с вероятностью 95% принимается основная гипотеза о том, что генеральная совокупность распределена по нормальному закону.
критерий хи-квадрат: 8,45 (число степеней свободы: 3; границы ОПГ: (0; 5,99));
критерий Колмогорова-Смирнова: 0,21 (границы ОПГ: (0; 0,18)).
Вывод относительно проверяемой гипотезы: с вероятностью 95% отвергается основная гипотеза о том, что генеральная совокупность распределена по равномерному закону.
Проверка гипотезы об однородности выборок
Существует два вида гипотез об однородности выборок. Может быть проверена однородность выборок «в слабом»: выборки однородны «в слабом», если незначимо отличаются их параметры, прежде всего, среднее. Может быть проверена однородность выборок «в сильном»: выборки однородны «в сильном», если незначимо отличаются их законы распределения.
С помощью критерия Стьюдента проверяется гипотеза об однородности выборок «в слабом». В этом случае основная гипотеза формулируется следующим образом: математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Формально это записывается так: .
где μ 1 и μ 2 — математические ожидания первой и второй выборок размерами n 1 и n 2 соответственно (в качестве оценок математических ожиданий берутся значения средних первой и второй выборок);
Критерий может принимать значения от минус бесконечности до плюс бесконечности. Чем ближе значения критерия к нулю, тем больше вероятность, что основная гипотеза будет верной (при этом знак не имеет значения).
При проверке гипотезы об однородности выборок с помощью критерия Стьюдента необходимо помнить, что к выборкам выдвигаются допущение, нарушение которых не позволяет применить критерий:
- выборки должны подчиняться нормальному распределению. Если это требование нарушается, то критерий не будет подчиняться распределению Стьюдента и, следовательно, границы области принятия гипотезы будут найдены неверно;
- в выборках не должны присутствовать резко выделяющиеся наблюдения, иначе среднее значение будет смещено в сторону выбросов и в результате критерий даст некорректный результат.
Пример 6. Имеются данные некоторой выборки. По ним в пакете программных средств STATISTICA вычислены следующие показатели:
Область принятия гипотезы при уровне значимости α = 0,05 : (-2,01; 2,01)
Значение t-критерия попадает в область принятия гипотезы. Может быть принята основная гипотеза о том, что математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Таким образом, проверена гипотеза об однородности выборок в слабом.
С помощью критерия Колмогорова-Смирнова проверяется гипотеза об однородности выборок «в сильном», то есть о том, что функции распределения выборок незначимо отличаются друг от друга. За основу критерия Колмогорова-Смирнова выступает статистика
максимальная по модулю разность между двумя функциями распределения выборок x и y.
Границы области принятия гипотезы определяются следующим образом:
Если критерий принадлежит области принятия гипотезы, то при заданном уровне значимости α нет возможности её отвергнуть, следовательно, принимается гипотеза о том, что выборки однородны «в сильном».
Гипотезы об однородности выборок могут быть выдвинуты как в исследованиях поведения человека, так и технических науках.
Пример 7. По данным некоторой выборки получены следующие показатели:
Область принятия гипотезы при уровне значимости α = 0,05 : (0; 0,189)
Значение критерия попадает в область принятия гипотезы. Следовательно, принимается основная гипотеза о том, что функции распределения двух выборок незначимо отличаются. Таким образом, выборки однородны «в сильном».
[expert_bq id=»1570″]Для того, чтобы быть в большей степени уверенности в своих суждениях о верности или неверности гипотезы, предпочитают применять несколько критериев и сравнивать результаты. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] Вне зависимости от типа критерия для того, чтобы найти квантили функции распределения, которому подчиняется критерий, необходимо знать параметры этой функции (например, если критерий подчиняется нормальному закону, то его параметрами являются математическое ожидание и стандартное отклонение). Значение параметров оценивается на выборках.Проверка статистических гипотез: основные понятия и примеры
- Если рассчитанное значение t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
- Если значение рассчитанного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.
В таком случае a называется квантилью функции распределения уровня b. Если левая и правые границы области — 1/4 и 3/4, то квантиль называется квартилью, если левая и правая границы области представляют собой дроби со знаменателем 10, то квантили называются децилями (понятия квартили, децилей, квинтилей и процентилей рассмотрены на уроке характеристики выборки и генеральной совокупности).