Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

5. 2. Доверительные интервалы для коэффициентов регрессии

Пусть требуется построить зависимость y(x).

Регрессией называют зависимость условного математического ожидания величины h (x) от x:

Задача регрессионного анализа состоит в восстановлении по результатам измерений <(xi,yi)>, i = 1, 2, …, n функциональной зависимости y(x).

Аппроксимируем искомую зависимость y(x) функцией f(x; a0, a1, …, ak).

Это означает, что результаты измерений можно представить в виде

где a0, a1, …, ak — неизвестные параметры регрессии, а e i — случайные величины, характеризующие погрешности эксперимента.

Обычно предполагается, что e i — это независимые нормально распределенные случайные величины с M( e i) = 0 и одинаковыми дисперсиями D( e i) = s 2 .

В случае простейшей линейной регрессии выдвигается гипотеза о том, что функция f(x; a0, a1, …, ak) зависит от двух параметров и имеет вид , .

Точечные оценки параметров регрессии известны, они вычисляются по формулам

, .

M( e i) = 0, D( e i) = s 2 обычно неизвестна, её оценку s 2 можно получить, например, методом максимального правдоподобия:

Оценки — несмещенные состоятельные оценки параметров регрессии .

Важно понимать, что точечные оценки — случайные величины, о которых известно, что они распределены нормально с математическими ожиданиями и дисперсиями .

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Используя информацию о статистических свойствах оценок , можно построить доверительные интервалы для оцениваемых параметров s 2 , a, b.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

имеет стандартное нормальное распределение и доверительный интервал

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

накрывает неизвестный параметр b с вероятностью 1– a . Здесь критическая точка x a — решение уравнения , где — функция Лапласа.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Если дисперсия s 2 неизвестна, то используем её оценку , в качестве критерия можно взять величину

она имеет распределение Стьюдента с (n – 2) степенями свободы и доверительный интервал

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

накрывает неизвестный параметр b с вероятностью 1– a .

Здесь критическая точка tn— 2, a — корень уравнения , Fn-2(tn— 2, a )— функция распределения Стьюдента с (n – 2) степенями свободы. Величину — стандартную ошибку регрессии, вычисляют по формуле :

Для того чтобы найти границы доверительного интервала, задаём малое значение a ,

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

находим соответствующую критическую точку, затем вычисляем точечную оценку параметра b и наконец — границы соответствующего доверительного интервала.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Если a — доверительная вероятность, и критическая точка x a — решение уравнения

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

, где Φ (x) — функция Лапласа, то доверительный интервал

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

накрывает оцениваемый параметр a с вероятностью 1– a .

Если же дисперсия неизвестна, то в качестве критерия можно взять величину

она имеет распределение Стьюдента с (n – 2) степенями свободы и поэтому интервал

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

накрывает оцениваемый параметр a с доверительной вероятностью 1– a .

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Здесь критическая точка tn— 2, a — корень уравнения , где F(tn— 2, a ) — функция распределения Стьюдента с (n – 2) степенями свободы.

Для того чтобы найти границы доверительного интервала, задаём малое значение a ,

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

находим соответствующую критическую точку, затем вычисляем точечную оценку параметра a и наконец — границы доверительного интервала.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Интервал накрывает неизвестную дисперсию s 2 с доверительной вероятностью 1– a .

Здесь критические точки и — решения уравнений и , где Fn-2(x)— функция распределения с (n – 2) степенями свободы.

Для того чтобы найти границы доверительного интервала, задаём малое значение a , находим критические точки, затем вычисляем точечную оценку параметра и наконец — границы соответствующего доверительного интервала.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Функция Excel СТЬЮДРАСПОБР(p, k) возвращает значение t, при котором P(|x| > t) = p, x значение случайной величины, имеющей распределение Стьюдента с k степенями свободы. Поэтому решение уравнения в Excel возвращает функция СТЬЮДРАСПОБР( a /2, n – 2).

В Excel функция распределения случайной величины определена нестандартно: F x (x) = P(x > x ). Поэтому решение уравнения возвращает функция ХИ2ОБР(1– a /2, n – 2) , а решение уравнения — ХИ2ОБР( a /2, n – 2).

Функция интервал в excel
Запускается окно аргументов. Устанавливаем курсор в поле «Число1» и с зажатой левой кнопкой мыши выделяем весь диапазон значений. После того, как координаты отобразились в поле, клацаем по кнопке «OK».
эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
Как мы помним, граница доверительного интервала вычисляется путем сложения и вычитания от среднего выборочного значения результата вычисления ДОВЕРИТ. Если же вы хотите что-то уточнить, обращайтесь ко мне!
В случае простейшей линейной регрессии выдвигается гипотеза о том, что функция f(x; a0, a1, …, ak) зависит от двух параметров и имеет вид , .
Формула расчета доверительного интервала

5. 2. Доверительные интервалы для коэффициентов регрессии

R 2 – коэффициент детерминированности, который показывает как близко уравнение описывает исходные данные. Чем ближе он к 1, тем больше сходится теоретическая зависимость и экспериментальные данные.

Функция интервал в excel

В качестве примера подсчета чисел возьмем список с числовыми значениями от 4 до 30 (См. файл примера ).

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Будем подсчитывать значения, попадающие в интервал, например, (4;15]. Причем, границы интервала «включает [ ]» и «не включает ( )» будем выбирать из Выпадающего (раскрывающегося) списка.

Примечание: решение без выбора интервалов = СЧЁТЕСЛИМН(A2:A12;»>»&D2;A2:A12;» Предполагается, что границы интервала введены в ячейки D2 и F2. Эти ячейки не должны быть пустыми, даже если одна из границ =0. Если в диапазоне A2:A12 содержатся числовые значения в текстовом формате, то они будут проигнорированы.

Для настройки границ интервала используем Проверку данных с типом данных Список. В качестве источника укажем для левой границы >;>= и для правой СЧЁТЕСЛИМН(A2:A12;C2&D2;A2:A12;E2&F2)

Функция ДОВЕРИТ в Excel предназначена для определения доверительного интервала для среднего значения, найденного для генеральной совокупности, которая имеет нормальное распределение.

Другими словами, рассматриваемая функция позволяет определить допустимые отклонения для найденного среднего значения с учетом известных уровня значимости (заданная вероятность того, что некоторое значение находится в доверительном интервале) и стандартного отклонения (меры степени разброса значений относительно среднего значения для генеральной совокупности).

Как построить доверительный интервал нормального распределения в Excel

Рассматриваемая функция была заменена функцией ДОВЕРИТ.НОРМ с версии Excel 2010. Функция ДОВЕРИТ была оставлена для обеспечения совместимости с документами, созданными в более ранних версиях табличного редактора.

Пример расчета доверительного интервала в Excel

Пример 1. В заводском цехе производят деталь, длина которой должна составлять 200 мм. Стандартное отклонение от длины – 3,6 мм. Для контроля качества деталей из партии (генеральная совокупность) делают выборку из 25 деталей. Определить интервал с доверительный уровнем 95%.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Для определения доверительного интервала используем функцию:

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

То есть, границы доверительного интервала соответствуют: (Xср-1,4112;Xср+1,4112). Допустим, было определено среднее значение выборки – 199,5 мм. Тогда доверительный интервал примерно определяется как (198,1;200,9), при этом номинальная длина детали (200 мм) находится в доверительном диапазоне, то есть производственный процесс не нарушен.

Как найти границы доверительного интервала в Excel

Пример 2. Были проведены опыты по определению скорости распространения звуковой волны в воздухе. Результаты 10 опытов записаны в таблицу. Определить левую и правую границы доверительного интервала для среднего значения.

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Поскольку уровень значимости не задан, используем стандартное значение – 0,05.

Правая граница определяется аналогично с разницей в том, что к среднему значению выборки прибавляется результат расчета функции ДОВЕРИТ:

Доверительные Интервалы Для Коэффициентов Регрессии в Эксель • Процедура вычисления

Как посчитать доверительный интервал по функции ДОВЕРИТ в Excel

  • альфа – обязательный, принимает числовое значение, характеризующее уровень значимости – вероятность отклонения нулевой (неверной) гипотезы в том случае, когда она на самом деле верна. Определяется как 1-, где  – уровень доверия (вероятность нахождения истинного значения некоторой оцениваемой величины в определенном интервале, называемом доверительным).
  • стандартное_откл – обязательный, принимает значение стандартного отклонения величины для генеральной совокупности значений (в Excel предусмотрена функция для определения этой величины – СТАНДОТКЛОН.Г).
  • размер – обязательный, принимает числовое значение, характеризующее количество точек данных в анализируемой выборке (ее размер).
  1. Все аргументы функции должны указываться в виде числовых значений или данных, которые могут быть преобразованы в числа (например, текстовые строки с числами, логические ИСТИНА, ЛОЖЬ). В противном случае результатом выполнения функции ДОВЕРИТ будет код ошибки #ЧИСЛО!
  2. Аргумент альфа должен быть указан числовым значением из диапазона от 0 до 1 (оба включительно). Иначе функция ДОВЕРИТ вернет код ошибки #ЧИСЛО! Аналогичная ошибка возникает в случаях, когда аргумент стандартное_откл задан числом, взятым из диапазона отрицательных значений или нулем.
  3. Диапазон допустимых значений для аргумента размер – от 1 до бесконечности со знаком плюс.

Процедура вычисления

Этот метод используется при интервальной оценке различных статистических величин. Главная задача данного расчета – избавится от неопределенностей точечной оценки.

В Экселе существуют два основных варианта произвести вычисления с помощью данного метода: когда дисперсия известна, и когда она неизвестна. В первом случае для вычислений применяется функция ДОВЕРИТ.НОРМ, а во втором — ДОВЕРИТ.СТЮДЕНТ.

Способ 1: функция ДОВЕРИТ.НОРМ

Оператор ДОВЕРИТ.НОРМ, относящийся к статистической группе функций, впервые появился в Excel 2010. В более ранних версиях этой программы используется его аналог ДОВЕРИТ. Задачей этого оператора является расчет доверительного интервала с нормальным распределением для средней генеральной совокупности.

«Альфа» — аргумент, указывающий на уровень значимости, который применяется для расчета доверительного уровня. Доверительный уровень равняется следующему выражению:

«Стандартное отклонение» — это аргумент, суть которого понятна из наименования. Это стандартное отклонение предлагаемой выборки.

Все аргументы данного оператора являются обязательными.

Функция ДОВЕРИТ имеет точно такие же аргументы и возможности, что и предыдущая. Её синтаксис таков:

Как видим, различия только в наименовании оператора. Указанная функция в целях совместимости оставлена в Excel 2010 и в более новых версиях в специальной категории «Совместимость». В версиях же Excel 2007 и ранее она присутствует в основной группе статистических операторов.

Граница доверительного интервала определяется при помощи формулы следующего вида:

Где X – это среднее выборочное значение, которое расположено посередине выбранного диапазона.

Теперь давайте рассмотрим, как рассчитать доверительный интервал на конкретном примере. Было проведено 12 испытаний, вследствие которых были получены различные результаты, занесенные в таблицу. Это и есть наша совокупность. Стандартное отклонение равно 8. Нам нужно рассчитать доверительный интервал при уровне доверия 97%.

Появляется Мастер функций. Переходим в категорию «Статистические» и выделяем наименование «ДОВЕРИТ.НОРМ». После этого клацаем по кнопке «OK».

Открывается окошко аргументов. Его поля закономерно соответствуют наименованиям аргументов.
Устанавливаем курсор в первое поле – «Альфа». Тут нам следует указать уровень значимости. Как мы помним, уровень доверия у нас равен 97%. В то же время мы говорили, что он рассчитывается таким путем:

Значит, чтобы посчитать уровень значимости, то есть, определить значение «Альфа» следует применить формулу такого вида:

Путем нехитрых расчетов узнаем, что аргумент «Альфа» равен 0,03. Вводим данное значение в поле.

Как известно, по условию стандартное отклонение равно 8. Поэтому в поле «Стандартное отклонение» просто записываем это число.

Появляется список недавно применяемых функций. Если оператор СЧЁТ применялся вами недавно, то он должен быть в этом списке. В таком случае, нужно просто кликнуть по его наименованию. В обратном же случае, если вы его не обнаружите, то переходите по пункту «Другие функции…».

Появляется уже знакомый нам Мастер функций. Опять перемещаемся в группу «Статистические». Выделяем там наименование «СЧЁТ». Клацаем по кнопке «OK».

Появляется окно аргументов вышеуказанного оператора. Данная функция предназначена для того, чтобы вычислять количество ячеек в указанном диапазоне, которые содержат числовые значения. Синтаксис её следующий:

Группа аргументов «Значения» представляет собой ссылку на диапазон, в котором нужно рассчитать количество заполненных числовыми данными ячеек. Всего может насчитываться до 255 подобных аргументов, но в нашем случае понадобится лишь один.

Устанавливаем курсор в поле «Значение1» и, зажав левую кнопку мыши, выделяем на листе диапазон, который содержит нашу совокупность. Затем его адрес будет отображен в поле. Клацаем по кнопке «OK».

После этого приложение произведет вычисление и выведет результат в ту ячейку, где она находится сама. В нашем конкретном случае формула получилась такого вида:

Но это ещё не все. Как мы помним, граница доверительного интервала вычисляется путем сложения и вычитания от среднего выборочного значения результата вычисления ДОВЕРИТ.НОРМ. Таким способом рассчитывается соответственно правая и левая граница доверительного интервала. Само среднее выборочное значение можно рассчитать при помощи оператора СРЗНАЧ.

Данный оператор предназначен для расчета среднего арифметического значения выбранного диапазона чисел. Он имеет следующий довольно простой синтаксис:

Аргумент «Число» может быть как отдельным числовым значением, так и ссылкой на ячейки или даже целые диапазоны, которые их содержат.

Итак, выделяем ячейку, в которую будет выводиться расчет среднего значения, и щелкаем по кнопке «Вставить функцию».

Открывается Мастер функций. Снова переходим в категорию «Статистические» и выбираем из списка наименование «СРЗНАЧ». Как всегда, клацаем по кнопке «OK».

Запускается окно аргументов. Устанавливаем курсор в поле «Число1» и с зажатой левой кнопкой мыши выделяем весь диапазон значений. После того, как координаты отобразились в поле, клацаем по кнопке «OK».

После этого СРЗНАЧ выводит результат расчета в элемент листа.

Производим расчет правой границы доверительного интервала. Для этого выделяем отдельную ячейку, ставим знак «=» и складываем содержимое элементов листа, в которых расположены результаты вычислений функций СРЗНАЧ и ДОВЕРИТ.НОРМ. Для того, чтобы выполнить расчет, жмем на клавишу Enter. В нашем случае получилась следующая формула:

Таким же образом производим вычисление левой границы доверительного интервала, только на этот раз от результата вычисления СРЗНАЧ отнимаем результат вычисления оператора ДОВЕРИТ.НОРМ. Получается формула для нашего примера следующего типа:

Мы попытались подробно описать все действия по вычислению доверительного интервала, поэтому детально расписали каждую формулу. Но можно все действия соединить в одной формуле. Вычисление правой границы доверительного интервала можно записать так:

Аналогичное вычисление левой границы будет выглядеть так:

Способ 2: функция ДОВЕРИТ.СТЮДЕНТ

Как видим, наименования операторов и в этом случае остались неизменными.

Посмотрим, как рассчитать границы доверительного интервала с неизвестным стандартным отклонением на примере всё той же совокупности, что мы рассматривали в предыдущем способе. Уровень доверия, как и в прошлый раз, возьмем 97%.

В открывшемся Мастере функций переходим в категорию «Статистические». Выбираем наименование «ДОВЕРИТ.СТЮДЕНТ». Клацаем по кнопке «OK».

Производится запуск окна аргументов указанного оператора.

В поле «Альфа», учитывая, что уровень доверия составляет 97%, записываем число 0,03. Второй раз на принципах расчета данного параметра останавливаться не будем.

После этого устанавливаем курсор в поле «Стандартное отклонение». На этот раз данный показатель нам неизвестен и его требуется рассчитать. Делается это при помощи специальной функции – СТАНДОТКЛОН.В. Чтобы вызвать окно данного оператора, кликаем по треугольнику слева от строки формул. Если в открывшемся списке не находим нужного наименования, то переходим по пункту «Другие функции…».

Запускается Мастер функций. Перемещаемся в категорию «Статистические» и отмечаем в ней наименование «СТАНДОТКЛОН.В». Затем клацаем по кнопке «OK».

Открывается окно аргументов. Задачей оператора СТАНДОТКЛОН.В является определение стандартного отклонения при выборке. Его синтаксис выглядит так:

Нетрудно догадаться, что аргумент «Число» — это адрес элемента выборки. Если выборка размещена единым массивом, то можно, использовав только один аргумент, дать ссылку на данный диапазон.

Устанавливаем курсор в поле «Число1» и, как всегда, зажав левую кнопку мыши, выделяем совокупность. После того, как координаты попали в поле, не спешим жать на кнопку «OK», так как результат получится некорректным. Прежде нам нужно вернуться к окну аргументов оператора ДОВЕРИТ.СТЮДЕНТ, чтобы внести последний аргумент. Для этого кликаем по соответствующему наименованию в строке формул.

Попав в окно аргументов СЧЁТ, ставим курсор в поле «Число1» и с зажатой кнопкой мыши выделяем совокупность. Затем клацаем по кнопке «OK».

После этого программа производит расчет и выводит значение доверительного интервала.

Для определения границ нам опять нужно будет рассчитать среднее значение выборки. Но, учитывая то, что алгоритм расчета при помощи формулы СРЗНАЧ тот же, что и в предыдущем способе, и даже результат не изменился, не будем на этом подробно останавливаться второй раз.

Сложив результаты вычисления СРЗНАЧ и ДОВЕРИТ.СТЮДЕНТ, получаем правую границу доверительного интервала.

Отняв от результатов расчета оператора СРЗНАЧ результат расчета ДОВЕРИТ.СТЮДЕНТ, имеем левую границу доверительного интервала.

Если расчет записать одной формулой, то вычисление правой границы в нашем случае будет выглядеть так:

Соответственно, формула расчета левой границы будет выглядеть так:

Как видим, инструменты программы Excel позволяют существенно облегчить вычисление доверительного интервала и его границ. Для этих целей используются отдельные операторы для выборок, у которых дисперсия известна и неизвестна.

Расчёт параметров регрессии и корреляции с помощью Excel — МегаЛекции
Программа Microsoft Excel имеет широкий набор математических функций, позволяющих решать непростые задачи. Ряд простейших действий — сложение, умножение и другие — выполнить очень легко, воспользовавшись специальными символами. Однако есть и те, .
эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
Здесь критическая точка t n — 2, a корень уравнения , где F t n — 2, a функция распределения Стьюдента с n 2 степенями свободы. Если же вы хотите что-то уточнить, обращайтесь ко мне!
Запускается окно аргументов. Устанавливаем курсор в поле «Число1» и с зажатой левой кнопкой мыши выделяем весь диапазон значений. После того, как координаты отобразились в поле, клацаем по кнопке «OK».

Построение доверительного интервала для математического ожидания генеральной совокупности

  • альфа – обязательный, принимает числовое значение, характеризующее уровень значимости – вероятность отклонения нулевой (неверной) гипотезы в том случае, когда она на самом деле верна. Определяется как 1-, где  – уровень доверия (вероятность нахождения истинного значения некоторой оцениваемой величины в определенном интервале, называемом доверительным).
  • стандартное_откл – обязательный, принимает значение стандартного отклонения величины для генеральной совокупности значений (в Excel предусмотрена функция для определения этой величины – СТАНДОТКЛОН.Г).
  • размер – обязательный, принимает числовое значение, характеризующее количество точек данных в анализируемой выборке (ее размер).
  1. Все аргументы функции должны указываться в виде числовых значений или данных, которые могут быть преобразованы в числа (например, текстовые строки с числами, логические ИСТИНА, ЛОЖЬ). В противном случае результатом выполнения функции ДОВЕРИТ будет код ошибки #ЧИСЛО!
  2. Аргумент альфа должен быть указан числовым значением из диапазона от 0 до 1 (оба включительно). Иначе функция ДОВЕРИТ вернет код ошибки #ЧИСЛО! Аналогичная ошибка возникает в случаях, когда аргумент стандартное_откл задан числом, взятым из диапазона отрицательных значений или нулем.
  3. Диапазон допустимых значений для аргумента размер – от 1 до бесконечности со знаком плюс.

Доверительные интервалы очень важны для понимания полученных данных и принятия решений по ним. Чтобы рассчитать ДИ для дискретной пропорции, используют SigmaXL> Шаблоны и калькуляторы> Основные статистические шаблоны> 1 интервал доверительных отношений. Перед тем как найти доверительный интервал в excel, выполняют следующие действия:

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector