Построение гистограмм распределения в Excel
Очень давно не писал блог. Расслабился совсем. Ну ничего, исправляюсь.
Продолжаю новую рубрику блога, посвященную анализу данных с помощью всем известного Microsoft Excel.
Статистический анализ в Excel можно осуществлять двумя способами:
• С помощью функций
• С помощью средств надстройки «Пакет анализа». Ее, как правило, еще необходимо установить.
Чтобы установить пакет анализа в Excel, выберите вкладку «Файл» (а в Excel 2007 это круглая цветная кнопка слева сверху), далее — «Параметры», затем выберите раздел «Надстройки». Нажмите «Перейти» и поставьте галочку напротив «Пакет анализа».
А теперь — к построению гистограмм распределения по частоте и их анализу.
Речь пойдет именно о частотных гистограммах, где каждый столбец соответствует частоте появления* значения в пределах границ интервалов. Например, мы хотим посмотреть, как у нас выглядит распределение значения предела текучести стали S355J2 в прокате толщиной 20 мм за несколько месяцев. В общем, хотим посмотреть, похоже ли наше распределение на нормальное (а оно должно быть таким).
*Примечание: для металловедческих целей типа оценки размера зерна или оценки объемной доли частиц этот вид гистограмм не пойдет, т.к. там высота столбика соответствует не частоте появления частиц определенного размера, а доле объема (а в плоскости шлифа — площади), которую эти частицы занимают.
График нормального распределения выглядит следующим образом:
Мы знаем, что реально такой график может быть получен только при бесконечно большом количестве измерений. Реально же для конечного числа измерений строят гистограмму, которая внешне похожа на график нормального распределения и при увеличении количества измерений приближается к графику нормального распределения (распределения Гаусса).
Построение гистограмм с помощью программ типа Excel является очень быстрым способом проверки стабильности работы оборудования и добросовестности коллектива: если получим «кривую» гистограмму, значит, либо прибор не исправен или мы данные неверно собрали, либо кто-то где-то преднамеренно мухлюет или же просто неверно использует оборудование.
-
Идем во вкладку «Анализ данных» и выбираем «Гистограмма».
Будет полезен тому, кто по каким-либо причинам не смог установить Пакет анализа.
Гистограмму-то мы построили, а что с ней делать дальше? В следующей статье расскажу о том, какую информацию можно извлечь из гистограмм. Так что не пропустите! А чтобы не пропустить, можно подписаться на обновления блога.
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.
Поделиться ссылкой:
Рубрика: Анализ данных в Excel. Метки: Анализ данных. Добавьте постоянную ссылку на эту страницу в закладки.
[expert_bq id=»1570″]Кликните правой кнопкой мыши по выделению и выберете в появившемся меню Изменитьтип диаграммы для ряда и поставьте флажек галочку напротив пункта Вспомогательная ось как показано на рисунке. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] Очень часто при проведении аналитики различных показателей для наглядности нужно уместить на одном графике или диаграмме показатели, выраженные в единицах и показатели в долях или процентах (%).Например: существуют данные о часовом потреблении электроэнергии двух различных электрических печей. Эти показатели выражаются в тысячах ватт.
НОУ ИНТУИТ | Лекция | Настройка и редактирование диаграмм
Расстояние между осью категорий и подписями делений устанавливается в счетчике Смещение вкладки Выравнивание диалогового окна Формат оси (рис. 28.16). Большее значение соответствует большему расстоянию между элементами.
Анализ данных и виды диаграмм: как выбрать визуализацию
Видов диаграмм очень много, но в управленческой отчетности чаще используется всего 5. И даже в них начинающие аналитики совершают одни и те же ошибки. А в результате получают от руководителей «по шапке»: потратил время, а отчет в итоге все равно непонятный.
Диаграммы нужны не для того, чтобы отчет стал красивым (хотя и это важно). Главная задача визуализации — четко отображать смысл данных.
Вот вам шпаргалка, которая поможет правильно использовать стандартные диаграммы в визуализации данных.
Вид анализа данных — основа для выбора диаграммы
Первое, что нужно сделать перед выбором визуализации — понять, что именно мы хотим показать. И какой вид анализа данных будем использовать.
Существует 4 базовых вида анализа. Для визуализации каждого из них можно использовать только определенные виды диаграмм: остальные исказят восприятие данных и просто не помогут увидеть нужное.
Рейтинг — этот вид анализа мы используем, когда нужно сравнить между собой несколько показателей. Например, понять, какой магазин приносит больше прибыли, кто из менеджеров заключил больше сделок, по какой статье у компании самые большие расходы (ну или самые маленькие). То есть это любое количественное сравнение по шкале, градация от большего к меньшему.
Динамика — такой вид анализа мы выбираем, когда нужно проследить изменение одного показателя. Например, определить сезонность для нашего товара, увидеть, как меняется объем продаж: когда есть пики, а когда — падения.
Структура — используется в случаях, когда нам важно разделить нечто целое на доли и показать объем каждой. Например, если нужно сегментировать клиентскую базу, группы товаров или оценить структуру клиентского портфеля. Абсолютные значения здесь отходят на второй план, на первом — именно доли.
Взаимосвязи — этот вид анализа редко используется в управленческой отчетности, но иногда случается, если нужно установить отношение между несколькими переменными. Например, сопоставить темпы продаж с курсом доллара или определить характер взаимосвязи между выручкой и количеством товара.
Базовые виды диаграмм
Для каждого вида анализа данных можно использовать только определенные визуализации. Есть 5 базовых и самых популярных видов диаграмм.
1. Линейчатая диаграмма. Это диаграмма с горизонтальными столбцами.
2. Гистограмма. Это диаграмма с вертикальными столбцами.
В английском языке обе диаграммы со столбцами называются барчартом, который может быть или горизонтальным, или вертикальным. Мы же привыкли к разным названиям, к тому же они используются и в продуктах MS Office.
3. График. Выглядит как линия с промежуточными точками данных на ней.
4. Круговая диаграмма. Сплошной круг, разделенный на сектора. Еще ее называют «пирогом» или пай чартом. Частный случай такой визуализации — кольцевая диаграмма, напоминающая по форме бублик.
5. Пузырьковая диаграмма. Английское название — Bubble Chart: размер пузырьков здесь служит дополнительным измерением данных. Это разновидность точечной диаграммы, которую также называют диаграммой рассеяния или scatter plot.
[expert_bq id=»1570″]Для изменения параметров оси необходимо дважды щелкнуть левой кнопкой по соответствующей оси или выделить ось и выполнить команду Формат Выделенная ось. Если же вы хотите что-то уточнить, обращайтесь ко мне![/expert_bq] Для изменения параметров оси необходимо дважды щелкнуть левой кнопкой по соответствующей оси или выделить ось и выполнить команду Формат/Выделенная ось. Настройка параметров оси производится во вкладках диалогового окна Формат оси.Гистограмма с переменной шириной столбцов
Ось, вдоль которой строятся ряды данных, называют осью категорий. Как правило, это горизонтальная ось, ось Х (см. рис. 28.11, рис. 28.12). В некоторых типах диаграмм (точечные и пузырьковые диаграммы) горизонтальная ось, ось Х, практически является осью значений.