Как Найти Размах в Статистике в Excel • Медиана и мода

Интервальный вариационный ряд и его характеристики

Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.

Здесь k — число интервалов, на которые разбивается ряд.

Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $ F=x_-x_ $

Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $ k=1+\lfloor\log_2 N\rfloor $ или, через десятичный логарифм: $ k=1+\lfloor 3,322\cdot\lg N\rfloor $

Скобка \(\lfloor\ \rfloor\) означает целую часть (округление вниз до целого числа).

Скобка \(\lceil\ \rceil\) означает округление вверх, в данном случае не обязательно до целого числа.

Заметим, что поскольку шаг h находится с округлением вверх, последний узел \(a_k\geq x_\).

п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения

Гистограмма относительных частот интервального ряда – это фигура, состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – относительным частотам каждого из интервалов.
Площадь гистограммы равна 1 (с точностью до округлений), и она является эмпирическим законом распределения исследуемого признака.

Накопленные относительные частоты – это суммы: $ S_1=w_1,\ S_i=S_+w_i,\ i=\overline $ Ступенчатая кривая \(F(x)\), состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – накопленным относительным частотам, является эмпирической функцией распределения исследуемого признака.
Кумулята – это ломаная, которая соединяет точки \((x_i,S_i)\), где \(x_i\) — середины интервалов.

Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:

Найдем середины интервалов, относительные частоты и накопленные относительные частоты:

п.3. Выборочная средняя, мода и медиана. Симметрия ряда

Медианным интервалом называют первый интервал слева, на котором кумулята превысила значение 0,5. Медиана интервального вариационного ряда определяется по формуле: $ M_e=x_o+\frac>h $ где
\(h\) – шаг интервального ряда;
\(x_o\) — нижняя граница медианного интервала;
\(S_\) накопленная относительная частота для интервала слева от медианного;
\(w_\) относительная частота медианного интервала.</0,5-S_

Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).

Например:
Для распределения учеников по росту получаем:

п.4. Выборочная дисперсия и СКО

Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $ \sigma=\sqrt $

Например:
Для распределения учеников по росту получаем:

$ D=\sum_^k x_i^2 w_i-X_^2=29578,08-171,7^2\approx 104,1 $ $ \sigma=\sqrt\approx 10,2 $

п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Исправленная выборочная дисперсия интервального вариационного ряда определяется как: \begin S^2=\fracD \end

Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $ s=\sqrt $

Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $ V=\frac>\cdot 100\text $

Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.

Например:
Для распределения учеников по росту получаем: \begin S^2=\frac\cdot 104,1\approx 105,1\\ s\approx 10,3 \end Коэффициент вариации: $ V=\frac\cdot 100\text\approx 6,0\text\lt 33\text $ Выборка однородна. Найденное значение среднего роста \(X_\)=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).

п.6. Алгоритм исследования интервального вариационного ряда

п.7. Примеры

Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.

1) Построим интервальный ряд. В наборе данных: $ x_=18,\ \ x_=38,\ \ N=30 $ Размах вариации: \(R=38-18=20\)
Оптимальное число интервалов: \(k=1+\lfloor\log_2⁡ 30\rfloor=1+4=5\)
Шаг интервального ряда: \(h=\lceil\frac\rceil=4\)
Получаем узлы ряда: $ a_0=x_=18,\ \ a_i=18+i\cdot 4,\ \ i=\overline $

Считаем частоты для каждого интервала. Получаем интервальный ряд:

Интервальный вариационный ряд и его характеристики: построение, гистограмма, выборочная дисперсия и СКО
Для начала вам нужно найти необработанное увеличение, поэтому вычтите начальное значение из второго значения. В нашем случае мы будем использовать = 246-129 чтобы получить результат 117.
[expert_bq id=»1570″]Например Для распределения учеников по росту получаем begin S 2 frac cdot 104,1 approx 105,1 s approx 10,3 end Коэффициент вариации V frac cdot 100 text approx 6,0 text lt 33 text Выборка однородна. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] (Если отсортированный ряд содержит нечетное число признаков, то номер медианы вычисляют по формуле: Ме = (n(число признаков в совокупности) + 1)/2, в случае четного числа признаков медиана будет равна средней из двух признаков находящихся в середине ряда).
Как Найти Размах в Статистике в Excel • Медиана и мода

Как рассчитать мода в Excel? Места и названия

На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце немного сбавить аппетит, чтобы тратить меньше денег, либо наоборот позволить себе не только хлеб с водой, но и колбасу.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: