Корреляционный Анализ в Excel Поэтапно Выполнить • Теоретическое отступление

Содержание

Корреляционный и статистический анализ экспериментальных данных в программе Excel

Корреляционным анализом называется
совокупность
методов
обнаружения
корреляционной
зависимости
между
случайными величинами или признаками.
При большом числе наблюдений, когда
коэффициенты
корреляции
необходимо
последовательно вычислять для нескольких
выборок,
для
удобства
получаемые
коэффициенты сводят в таблицы, называемые
корреляционными матрицами.

1
1
2
3
4
5
6
7
2
3
4
5
6
7
r=1
r(1;2)
r=1
r(1;3) r(2;3)
r=1
r(1;4) r(2;4) r(3;4)
r=1
r(1;5) r(2;5) r(3;5) r(4;5)
r=1
r(1;6) r(2;6) r(3;6) r(4;6) r(5;6)
r=1
r(1;7) r(2;7) r(3;7) r(4;7) r(5;7) r(6;7)
1, 2, …, 7 – отдельные показатели;
r – коэффициент корреляции между показателями.
r=1

Хотя в результате будет получена
треугольная
матрица,
корреляционная
матрица симметрична. Подразумевается, что
в пустых клетках в правой верхней половине
таблицы находятся те же коэффициенты
корреляции, что и в нижней левой
(симметрично расположенные относительно
диагонали). То есть r(xj, xk) = r(xk, xj).
Например: r(2;5) = r(5;2)

Этапы корреляционного анализа

1. Оформить в программе Excel
экспериментальные данные в виде таблицы;
2. Построить корреляционную матрицу c
помощью пакета “Анализ данных…”;
3. Оценить каждый коэффициент корреляции;
4. Нарисовать граф (графическую структуру)
корреляционной матрицы средствами
рисования программы Excel или Word;
5. Сделать вывод.

Пусть спортивные результаты группы спортсменов набраны в программе Excel.

Тогда для построения
корреляционной матрицы
по показателям надо:
1) Выбрать пункт «Данные»
→ команду «Анализ
данных» → инструмент
«Корреляция» → ОК
Откроется диалоговое окно!
2) Для входного интервала
на рабочем листе выделить
диапазон всех данных с
метками (С5-F13)

3) Установить галочку в окошке «Метки в первой строке» → Группирование по столбцам → Выходной интервал в пустой ячейке → ОК

Построится
корреляционная матрица
Все получившиеся
коэффициенты
корреляции округлить
до сотых, используя
инструмент
«Уменьшение
разрядности»

§3 Граф корреляционной матрицы

Граф построенный на основе корреляционной
матрицы отображает наиболее значимые связи
между спортивными результатами, а так же
визуально выявляет не значимые показатели.

Построение графа корреляционной матрицы

1) Сначала вводятся обозначения:
— сильные связи
— связи средней силы
— слабые связи
2) Далее с помощью инструмента
— «надпись»
обозначения
показателей
располагаются
равномерно, по порядку, по кругу. Для этого
удобно на окружности отметить нужное количество
точек на одинаковом расстоянии. У каждой
надписи отменить контур и заливку фигуры.

Например:

1
Например:
3) Соединить
показатели
7
линиями,
применяя к
ним нужный
формат
6
контура.
Если r(3;7) указывает
на сильную взаимосвязь
между показателями 3 и
7, то от точки 3 до точки
7 рисуем линию и
изменяем её толщину.
2
3
5
4
Причём не важно, какая это
связь прямая или обратная.

4) Когда все значимые связи будут изображены на графе, удалить круг (окружность)

1
4) Когда все
значимые связи
7
будут изображены
на графе, удалить
круг (окружность)
2
6
5
Если |r| ≤ 0,2, то на
графике такую взаимосвязь
отображать не нужно
3
4

Например:
Пусть показатель П3 результаты тройного прыжка ПБР
в данной группе спортсменов.
Тогда из данного графа
видно, что тройной прыжок П
СР
выпадает из общей картины
взаимосвязей.
Б4
ВР
СБ
П5
П3
Следовательно, в данной группе спортсменов
тройной прыжок можно исключить из тренировочного
процесса и заменить его другими упражнениями,
которые повышают эффективность тренировок.

§4 Статистический анализ в Excel

Одним из инструментов пакета «Анализ данных…» является инструмент «Описательная статистика».

Цель
«Описательной статистики» обобщить первичные результаты, полученные
в результате наблюдений и экспериментов.
Это средство анализа служит для создания
одномерного
статистического
отчёта
содержащего информацию о центральной
тенденции и изменчивости или вариации
входных данных.

В состав описательной статистики входят
следующие характеристики:
ЦЕНТРАЛЬНЫЕ ТЕНДЕНЦИИ
среднее;
стандартная
ошибка;
медиана;
мода
ИЗМЕНЧИВОСТЬ ДАННЫХ
стандартное
отклонение;
дисперсия выборки;
эксцесс;
асимметричность;
интервал;
минимум;
максимум;
сумма;
счет

Порядок построения таблицы основных статистических характеристик

Пусть в программе Excel набраны данные.
Тогда для построения таблицы с итоговой
описательной статистикой надо:
1) Выбрать пункт «Данные» → команду «Анализ
данных» → инструмент «Описательная
статистика» → ОК
Откроется диалоговое окно!
2) Для входного интервала на рабочем листе
выделить диапазон данных с метками
(названиями столбцов)

3) Установить галочку в окошке «Метки в
первой строке» → Группирование по
столбцам → Выходной интервал в пустой
ячейке → Флажок «Итоговая статистика»
→ уровень надёжности 95% → ОК

Округлить характеристики,
которые необходимо, до
сотых с помощью значка на
панели инструментов
«Уменьшение
разрядности».
Сделать вывод

Подготовить презентацию к защите РГР «Корреляционный и статистический анализ данных»

Требования к презентации:

Корреляционный и статистический анализ экспериментальных данных в программе Excel - презентация онлайн
Параметр «Группирование» оставляем без изменений – «По столбцам», так как у нас группы данных разбиты именно на два столбца. Если бы они были разбиты построчно, то тогда следовало бы переставить переключатель в позицию «По строкам».
эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
Это средство анализа служит для создания одномерного статистического отчёта содержащего информацию о центральной тенденции и изменчивости или вариации входных данных. Если же вы хотите что-то уточнить, обращайтесь ко мне!
​. Тут указывается какое​​ вручную с клавиатуры,​​Внизу, в качестве примера,​​Регрессионный анализ является одним​​ отличие от предыдущего​ нас это затраты​ статистического исследования. Коэффициент​anvg​ автоматически.​ данной колонке. Это​ примерно от 130​ на другую величину,​ меню выбираем «Добавить​
Корреляционный Анализ в Excel Поэтапно Выполнить • Теоретическое отступление

Корреляционно-регрессионный анализ в Excel: инструкция выполнения

Коэффициент корреляции отражает степень взаимосвязи между двумя показателями. Всегда принимает значение от -1 до 1. Если коэффициент расположился около 0, то говорят об отсутствии связи между переменными.

Корреляционно-регрессионный анализ в MS EXCEL

Предназначение корреляционного анализа сводится к выявлению наличия зависимости между различными факторами. То есть, определяется, влияет ли уменьшение или увеличение одного показателя на изменение другого.

Регрессионный анализ в Microsoft Excel

​«Анализ»​ следует определить. В​Предназначение корреляционного анализа сводится​ стоят в таблице.​ инструментов анализа выбираем​ коэффициента корреляции выглядит​ рассеяния:​ качество, и т.п.​На практике эти две​ на отрицательное влияние:​ будет надпись «Надстройки​ платы и др.​ значения пропускаются; однако​ качество модели. В​ можно оставить по​

Читайте также: Microsoft .NET Framework 1.1 — 4.8 [16.08.2019] (2019) PC | RePack by D!akov скачать торрент

Подключение пакета анализа

​. Жмем на кнопку​ нашем случае это​ к выявлению наличия​А как вы​ «Корреляция».​ так:​Каждая точка дает представление​Диаграммы рассеяния применяются для​ методики часто применяются​

    ​ чем больше зарплата,​​ Excel» (если ее​​ параметров. Или: как​

​ факторами. То есть,​ Ось на то​​ для анализа данных.​​ разобьем на несколько​ и контактах (как​​ данными. Если корреляционная​​Пример:​ Что справедливо.​​ флажок справа и​​ цены на энергоресурсы​

Виды регрессионного анализа

​ она и ось,​ Входной интервал –​ несложных элементов.​ об одномерных совокупностях)​

Линейная регрессия в программе Excel

​ зависимость присутствует, то​Строим корреляционное поле: «Вставка»​​ выберите). И кнопка​ и др. на​ имеют различное количество​ Это приемлемый уровень​указываем адрес диапазона​логарифмическая;​ Результат вычислений, если​Открывается список с различными​ внести адрес массива​ уменьшение или увеличение​ что на ней​

    ​ 0,5 является плохой.​​ переменные данные, влияние​​показательная;​ правильно, будет полностью​​ Выбираем пункт​​ выделяем все ячейки​​ изменение другого.​​ идет.​

​ управленческие решения.​ их значений равно​и столбца​​ столбца «Количество покупателей».​​ Экселе мы подробнее​

Разбор результатов анализа

​ расчета.​Открывается окно с параметрами​нужно внести координаты​ единственный показатель, который​________________________​

​ начнется построение матрицы.​Теперь перемножим найденные разности:​​ период (вертикальная ось)​​ одну величину рассматривать​ на диаграмме. Потом​ ценой техники и​Теперь займемся непосредственно регрессионным​Регрессия бывает:​ нулю, функция КОРРЕЛ​«Коэффициенты»​ Адрес можно вписать​

​ поговорим далее.​Автор: Максим Тютюшев​ корреляционного анализа. В​​ второго столбца. У​​ рассчитывает данный метод​​​​ Размер диапазона определится​Найдем сумму значений в​ находятся в диапазоне​ как «причину», влияющую​ правой. В открывшемся​ продолжительностью эксплуатации, ростом​ анализом.​линейной (у = а​ возвращает значение ошибки​

​. Тут указывается какое​​ вручную с клавиатуры,​​Внизу, в качестве примера,​​Регрессионный анализ является одним​​ отличие от предыдущего​ нас это затраты​ статистического исследования. Коэффициент​anvg​ автоматически.​ данной колонке. Это​ примерно от 130​ на другую величину,​ меню выбираем «Добавить​

​ и весом детей​Открываем меню инструмента «Анализ​ + bx);​ #ДЕЛ/0!.​ значение будет у​ а можно, просто​ представлена таблица, в​ из самых востребованных​ способа, в поле​

Расчет коэффициента корреляции

Теперь давайте попробуем посчитать коэффициент корреляции на конкретном примере. Имеем таблицу, в которой помесячно расписана в отдельных колонках затрата на рекламу и величина продаж. Нам предстоит выяснить степень зависимости количества продаж от суммы денежных средств, которая была потрачена на рекламу.

Способ 1: определение корреляции через Мастер функций

Одним из способов, с помощью которого можно провести корреляционный анализ, является использование функции КОРРЕЛ. Сама функция имеет общий вид КОРРЕЛ(массив1;массив2).

Открывается окно аргументов функции. В поле «Массив1» вводим координаты диапазона ячеек одного из значений, зависимость которого следует определить. В нашем случае это будут значения в колонке «Величина продаж». Для того, чтобы внести адрес массива в поле, просто выделяем все ячейки с данными в вышеуказанном столбце.

В поле «Массив2» нужно внести координаты второго столбца. У нас это затраты на рекламу. Точно так же, как и в предыдущем случае, заносим данные в поле.

Как видим, коэффициент корреляции в виде числа появляется в заранее выбранной нами ячейке. В данном случае он равен 0,97, что является очень высоким признаком зависимости одной величины от другой.

Способ 2: вычисление корреляции с помощью пакета анализа

Кроме того, корреляцию можно вычислить с помощью одного из инструментов, который представлен в пакете анализа. Но прежде нам нужно этот инструмент активировать.

В открывшемся окне перемещаемся в раздел «Параметры».

В нижней части следующего окна в разделе «Управление» переставляем переключатель в позицию «Надстройки Excel», если он находится в другом положении. Жмем на кнопку «OK».

В окне надстроек устанавливаем галочку около пункта «Пакет анализа». Жмем на кнопку «OK».

После этого пакет анализа активирован. Переходим во вкладку «Данные». Как видим, тут на ленте появляется новый блок инструментов – «Анализ». Жмем на кнопку «Анализ данных», которая расположена в нем.

Открывается список с различными вариантами анализа данных. Выбираем пункт «Корреляция». Кликаем по кнопке «OK».

Открывается окно с параметрами корреляционного анализа. В отличие от предыдущего способа, в поле «Входной интервал» мы вводим интервал не каждого столбца отдельно, а всех столбцов, которые участвуют в анализе. В нашем случае это данные в столбцах «Затраты на рекламу» и «Величина продаж».

Параметр «Группирование» оставляем без изменений – «По столбцам», так как у нас группы данных разбиты именно на два столбца. Если бы они были разбиты построчно, то тогда следовало бы переставить переключатель в позицию «По строкам».

В параметрах вывода по умолчанию установлен пункт «Новый рабочий лист», то есть, данные будут выводиться на другом листе. Можно изменить место, переставив переключатель. Это может быть текущий лист (тогда вы должны будете указать координаты ячеек вывода информации) или новая рабочая книга (файл).

Так как место вывода результатов анализа было оставлено по умолчанию, мы перемещаемся на новый лист. Как видим, тут указан коэффициент корреляции. Естественно, он тот же, что и при использовании первого способа – 0,97. Это объясняется тем, что оба варианта выполняют одни и те же вычисления, просто произвести их можно разными способами.

Как видим, приложение Эксель предлагает сразу два способа корреляционного анализа. Результат вычислений, если вы все сделаете правильно, будет полностью идентичным. Но, каждый пользователь может выбрать более удобный для него вариант осуществления расчета.

Отблагодарите автора, поделитесь статьей в социальных сетях.

Линейная регрессия в Excel

Теперь, когда под рукой есть все необходимые виртуальные инструменты для осуществления эконометрических расчетов, можем приступить к решению нашей задачи. Для этого:

  • щелкаем по кнопке «Анализ данных»;
  • в открывшемся окне нажимаем на кнопку «Регрессия»;
  • в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
  • подтверждаем свои действия нажатием кнопки «Ok».

В результате программа автоматически заполнит новый лист табличного процессора данными анализа регрессии. Обратите внимание! В Excel есть возможность самостоятельно задать место, которое вы предпочитаете для этой цели. Например, это может быть тот же лист, где находятся значения Y и X, или даже новая книга, специально предназначенная для хранения подобных данных.

Введение

Чтобы рассчитать коэффициент корреляции, необходимо воспользоваться специальной функцией КОРРЕЛ. Формула содержит аргументы для двух массивов данных, между которыми нужно найти зависимость. Полученный коэффициент корреляции в excel можно расшифровать следующим образом:

  1. Если значение близко к 1 или -1, то существует сильная прямая или обратная связь между величинами.
  2. Коэффициент около 0,5 или -0,5 говорит о том, что между массивами слабая взаимосвязь.
  3. Если получается число близкое к нулю, то величины не связаны между собой.

При этом есть ряд особенностей использования функции КОРРЕЛ:

  1. Программа не учитывает в расчете пустые ячейки, элементы массива с текстовым форматом и ячейки с логическими операторами. При этом числа в виде текста будут учтены.
  2. Размеры двух массивов должны быть одинаковыми, в противном случае редактор выдаст ошибку типа Н/Д.
  3. При корреляционном анализе нельзя использовать пустые столбцы или диапазон с нулевыми значениями.

Коэффициент корреляции: что нужно знать, формула, пример расчёта в Excel

Приветствую всех читателей моего блога! Давненько я не писал статей по основам инвестирования. Сегодня хочу рассказать вам таком понятии как корреляция, которая имеет отношение к созданию качественного инвестиционного портфеля и диверсификации ваших вложений.

Если говорить о том, что такое корреляция простыми словами, то это по сути связь между двумя явлениями, выраженными в числовой форме. Например, проанализировав данные по ВВП на душу населения и продолжительности жизни в странах мира, мы невооруженным глазом заметим тенденцию:

А благодаря расчёту коэффициента корреляции мы можем узнать силу взаимосвязи в конкретном числовом выражении. Это очень удобно и полезно при анализе данных в самых разных областях науки, в том числе в экономике и инвестировании.

Сегодня я расскажу вам подробнее о том, что такое корреляция простыми словами, без сложных формул и терминов. Также я покажу вам, как правильно и легко рассчитать коэффициент корреляции в Excel и как правильно интерпретировать результаты, чтобы использовать их для составления инвестиционного портфеля.

А чтобы не пропускать следующие статьи блога, подписывайтесь на мой Телеграм-канал! Там же я выкладываю отчёты по инвестициям, сообщаю об обновлениях в моем инвест-портфеле и иногда пишу заметки на интересные темы. Даже чатик инвесторов у нас есть, присоединяйтесь

Задача №3. Расчёт параметров регрессии и корреляции с помощью Excel
Открывается окно с параметрами корреляционного анализа. В отличие от предыдущего способа, в поле «Входной интервал» мы вводим интервал не каждого столбца отдельно, а всех столбцов, которые участвуют в анализе. В нашем случае это данные в столбцах «Затраты на рекламу» и «Величина продаж».
эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
Если r 3;7 указывает на сильную взаимосвязь между показателями 3 и 7, то от точки 3 до точки 7 рисуем линию и изменяем её толщину. Если же вы хотите что-то уточнить, обращайтесь ко мне!
Линейная функция является моделью взаимосвязи между X иY и показывает ожидаемое значение Y при заданном X. Коэффициент детерминации – это соотношение дисперсии ожидаемых Y (точек на прямой линии) к общей дисперсии Y, или доля объясненной вариации Y. При r = 0,1 r 2 = 0,01 или 1%, при r = 0,5 r 2 = 0,25 или 25%.

Корреляция и ковариация в EXCEL. Примеры и описание

  • щелкаем по кнопке «Анализ данных»;
  • в открывшемся окне нажимаем на кнопку «Регрессия»;
  • в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
  • подтверждаем свои действия нажатием кнопки «Ok».

В параметрах вывода по умолчанию установлен пункт «Новый рабочий лист», то есть, данные будут выводиться на другом листе. Можно изменить место, переставив переключатель. Это может быть текущий лист (тогда вы должны будете указать координаты ячеек вывода информации) или новая рабочая книга (файл).

Задача №3. Расчёт параметров регрессии и корреляции с помощью Excel

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2. Рассчитайте параметры уравнения линейной регрессии

Линейная функция

.

3. Оцените тесноту связи с помощью показателей корреляции и детерминации.

4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

5. Оцените с помощью средней ошибки аппроксимации качество уравнений.

6. Оцените с помощью F-критерия Фишера статистическую надёжность результатов регрессионного моделирования.

Уровень значимости 0,05

7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости .

8. Оцените полученные результаты, выводы оформите в аналитической записке.

Решение:

Чтобы построить поле корреляции можно воспользоваться ППП Excel. Введите исходные данные в последовательности: сначала х, затем у.

Затем выберете: Вставка / Точечная диаграмма / Точечная с маркерами как показано на рисунке 1.

Поле корреляции

Анализ поля корреляции показывает наличие близкой к прямолинейной зависимости, так как точки расположены практически по прямой линии.

Линейная функция

2. Для расчёта параметров уравнения линейной регрессии
воспользуемся встроенной статистической функцией ЛИНЕЙН.

Диалоговое окно «Мастер функций»

Известные значения у – диапазон, содержащий данные результативного признака;

Известные значения х – диапазон, содержащий данные факторного признака;

Константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член равен 0;

Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.

Диалоговое окно аргументов функции ЛИНЕЙН

Рисунок 3 Диалоговое окно аргументов функции ЛИНЕЙН

6) В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу , а затем на комбинацию клавиш ++ .

Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме:

Значение коэффициента b Значение коэффициента a
Стандартная ошибка b Стандартная ошибка a
Коэффициент детерминации R 2 Стандартная ошибка y
F-статистика Число степеней свободы df
Регрессионная сумма квадратов

Факторная сумма квадратов

Остаточная сумма квадратов

Результат вычисления функции ЛИНЕЙН

Уравнение линейной регрессии

Делаем вывод: С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.

Коэффициент детерминации

3. Коэффициент детерминации означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х – среднедушевого прожиточного минимума, а 48% — действием других факторов, не включённых в модель.

По вычисленному коэффициенту детерминации можно рассчитать коэффициент корреляции: .

4. С помощью среднего (общего) коэффициента эластичности определим силу влияния фактора на результат.

Уравнение линейной регрессии

Для уравнения прямой средний (общий) коэффициент эластичности определим по формуле:

Средний показатель эластичности

Средние значения найдём, выделив область ячеек со значениями х, и выберем Формулы / Автосумма / Среднее, и то же самое произведём со значениями у.

Расчёт средних значений функции и аргумента

Рисунок 5 Расчёт средних значений функции и аргумент

Расчёт среднего показателя эластичности

Таким образом, при изменении среднедушевого прожиточного минимума на 1% от своего среднего значения среднедневная заработная плата изменится в среднем на 0,51%.

С помощью инструмента анализа данных Регрессия можно получить:
— результаты регрессионной статистики,
— результаты дисперсионного анализа,
— результаты доверительных интервалов,
— остатки и графики подбора линии регрессии,
— остатки и нормальную вероятность.

1) проверьте доступ к Пакету анализа. В главном меню последовательно выберите: Файл/Параметры/Надстройки.

2) В раскрывающемся списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.

3) В окне Надстройки установите флажок Пакет анализа, а затем нажмите кнопку ОК.

• Если Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор, чтобы выполнить поиск.

• Если выводится сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да, чтобы установить его.

4) В главном меню последовательно выберите: Данные / Анализ данных / Инструменты анализа / Регрессия, а затем нажмите кнопку ОК.

5) Заполните диалоговое окно ввода данных и параметров вывода:

Входной интервал Y – диапазон, содержащий данные результативного признака;

Входной интервал X – диапазон, содержащий данные факторного признака;

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа – ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

6) Новый рабочий лист – можно задать произвольное имя нового листа.

Диалоговое окно ввода параметров инструмента Регрессия

Рисунок 6 Диалоговое окно ввода параметров инструмента Регрессия

Результаты регрессионного анализа для данных задачи представлены на рисунке 7.

Результат применения инструмента регрессия

Рисунок 7 Результат применения инструмента регрессия

5. Оценим с помощью средней ошибки аппроксимации качество уравнений. Воспользуемся результатами регрессионного анализа представленного на Рисунке 8.

Результат применения инструмента регрессия «Вывод остатка»

Рисунок 8 Результат применения инструмента регрессия «Вывод остатка»

Составим новую таблицу как показано на рисунке 9. В графе С рассчитаем относительную ошибку аппроксимации по формуле:

Относительная ошибка аппроксимации

Расчёт средней ошибки аппроксимации

Средняя ошибка аппроксимации рассчитывается по формуле:

Формула и расчёт средней ошибки аппроксимации

Средняя ошибка аппроксимации

Качество построенной модели оценивается как хорошее, так как не превышает 8 – 10%.

Фактическое значение F-критерия

6. Из таблицы с регрессионной статистикой (Рисунок 4) выпишем фактическое значение F-критерия Фишера:

Табличное значение F-критерия

Фактическое значение F-критерия больше табличного

Поскольку при 5%-ном уровне значимости, то можно сделать вывод о значимости уравнения регрессии (связь доказана).

8. Оценку статистической значимости параметров регрессии проведём с помощью t-статистики Стьюдента и путём расчёта доверительного интервала каждого из показателей.

Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля:

параметры уравнения и коэффициент корреляции равны нулю

.

для числа степеней свободы

На рисунке 7 имеются фактические значения t-статистики:

Расчётные значения t-критерия для параметров регрессии

t-критерий для коэффициента корреляции можно рассчитать двумя способами:

Расчётное значение t-критерия для коэффициента корреляции

I способ:

Случайная ошибка коэффициента корреляции

где – случайная ошибка коэффициента корреляции.

Данные для расчёта возьмём из таблицы на Рисунке 7.

Расчёт t-критерия для коэффициента корреляции

Расчёт t-статистики для коэффициента корреляции

II способ:

Фактические значения t-статистики превосходят табличные значения:

Сравнение расчётных и табличных значений t-критерия

Сравнение фактического и табличного t-критерия для показателя корреляции

Поэтому гипотеза Н0 отклоняется, то есть параметры регрессии и коэффициент корреляции не случайно отличаются от нуля, а статистически значимы.

Доверительный интервал для параметра a определяется как

Формула расчёта доверительного интервала для параметра а

Для параметра a 95%-ные границы как показано на рисунке 7 составили:

Доверительный интервал для параметра а

Доверительный интервал для коэффициента регрессии определяется как

Формула расчёта доверительного интервала коэффициента регрессии

Для коэффициента регрессии b 95%-ные границы как показано на рисунке 7 составили:

Доверительный интервал для коэффициента регрессии

Значение вероятности

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.

7. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:

Расчёт прогнозного значения фактора

Тогда прогнозное значение прожиточного минимума составит:

Расчёт прогнозного значения результата

Формула средней ошибки прогнозируемого индивидуального значения у

Сумма квадратов отклонений фактического значения от среднего

где

Дисперсию посчитаем также с помощью ППП Excel. Для этого:

1) Активизируйте Мастер функций: в главном меню выберете Формулы / Вставить функцию.

2) В окне Категория выберете Статистические, в окне функция – ДИСП.Г. Щёлкните по кнопке ОК.

3) Заполните диапазон, содержащий числовые данные факторного признака. Нажмите ОК.

Расчёт дисперсии

Дисперсия фактора

Получили значение дисперсии

Для подсчёта остаточной дисперсии на одну степень свободы воспользуемся результатами дисперсионного анализа как показано на Рисунке 7.

Формула и расчёт остаточной дисперсии на одну степень свободы

Расчёт средней ошибки прогнозируемого индивидуального значения у

Прогнозное значение фактора

Доверительные интервалы прогноза индивидуальных значений у при с вероятностью 0,95 определяются выражением:

Интервал достаточно широк, прежде всего, за счёт малого объёма наблюдений. В целом выполненный прогноз среднемесячной заработной платы оказался надёжным.

Условие задачи взято из: Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2003. – 192 с.: ил.

эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
Корреляционная матрица это квадратная или прямоугольная таблица, в которой на пересечении соответствующих строки и столбца находится коэффициент корреляции между соответствующими параметрами. Если же вы хотите что-то уточнить, обращайтесь ко мне!
Коэффициент корреляции определяется некоторыми данными. Если уровень показателя составляет от 0 до 0.3, то в таком случае связи нет. Если показатель составляет от 0.3 до 0.5 — это слабая связь. Если показатель доходит до 0.7, то связь средняя. Высокой можно назвать когда показатель достигает отметки 0.7-0.9. Если показатель составляет 1 — это наиболее сильная связь.

Линейный коэффициент корреляции Пирсона.

С расчётом корреляции я как студент экономического ВУЗа познакомился еще на втором курсе. Тем не менее, долгое время недооценивал важность расчёта корреляции именно для подбора ПАММ-портфеля. 2022 год очень четко показал, что ПАММ-счета с похожими стратегиями в случае кризиса могут вести себя очень похоже.

Значение коэффициента b Значение коэффициента a
Стандартная ошибка b Стандартная ошибка a
Коэффициент детерминации R 2 Стандартная ошибка y
F-статистика Число степеней свободы df
Регрессионная сумма квадратов
Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector