Как Установить в Эксель Анализ Данных • Исходные данные

Русские Блоги

Когда Excel не достаточно, как использовать Access для анализа данных?

Что делать, если объем данных слишком велик для Excel? Существуют ли другие инструменты, которые могут заменить Excel, но просты в использовании?

Этот вопрос действительно ударил по рукам. Я получил много подобных вопросов. Я отвечу на них сегодня единым образом.

Большой объем данных для отчетности или анализа данных

Более 100 мегабайт, сотни тысяч строк данных в формате Excel: база данных ACCESS + SQL

Если данные не достигают сотен миллионов уровней, используйте инструменты BI для непосредственного анализа

Независимо от того, насколько он большой, он не похож на двоюродного брата или двоюродного брата, его может решить аналитик данных.

Принимая во внимание общее использование Excel в повседневной жизни, эта статья будет в основном рассказывать о программах первого типа и предлагает полный учебник, универсальный и практичный. Используемый инструмент — база данных ACCESS.

Что касается ACCESS, его брата по Excel, того же Microsoft Office, то нетрудно начать, получить основную операцию за неделю.

Это может решить следующие жалобы небольших партнеров, которые выполняют операции с данными:

 excel , Access ?

Данные Excel с большим объемом данных трудно открыть

При обнаружении таблицы данных Excel с таким большим объемом памяти, как показано на рисунке выше, карта неизбежна. Когда возникают такие трудности, существует ли какое-либо программное обеспечение для анализа данных, которое может обрабатывать файлы большой емкости, в то же время простое в использовании и простое в использовании?

Ответ, конечно: ДА, и тот же брат Excel, ДОСТУП фракции Microsoft Office.

В следующем содержании в качестве примера будет использован общий проект по анализу, и мы стремимся дать партнерам, которые проводят анализ данных, общее представление о ACCESS, чтобы найти идеи и методы для анализа больших объемов данных.

На следующем рисунке показаны четыре основные цели этой статьи, использующие ACCESS для анализа исходных данных таблицы.

 excel , Access ?

Вот два предложения об основной ситуации доступа, а затем использовать практический случай для анализа данных.

1. Введение в базу данных ACCESS

1. Основные понятия операторов ACCESS и SQL

Когда дело доходит до ACCESS, вы должны упомянуть SQL. Только овладев SQL, вы сможете максимизировать функции ACCESS. Полное имя SQL — «Язык структурированных запросов», который является декларативным языком.

Во-первых, помните об этой концепции: «Декларация». По сравнению с языками программирования, известными всем в прошлом, язык SQL является примером для компьютера, который объявляет, какие результаты вы хотите получить из исходных данных, вместо того, чтобы сообщать компьютеру, как получить результаты. Другими словами, настоящее ядро ​​SQL — это ссылка на таблицу.

Приведенный выше пример прост для понимания. Нам не нужно заботиться о том, откуда берутся данные о сотрудниках. Все, что нам нужно, это данные о сотрудниках в возрасте 25 лет и старше (возраст> = 25).

Наиболее очевидным преимуществом ACCESS является то, что он может обрабатывать исходные файлы данных большой емкости, которые Excel не может переносить без необходимости владения очень глубоким языком программирования, он чрезвычайно быстр и прост в изучении и использовании.

 excel , Access ?

В следующей таблице приведены некоторые часто используемые операторы SQL при использовании ACCESS, которые нетрудно понять.

 excel , Access ?

Названия часто используемых операторов SQL в базе данных ACCESS

Чтобы изучить инструменты анализа данных, наиболее важным является использование практических кейсов для мобилизации знаний о различных фрагментированных инструментах. После полного анализа кейсов вы сможете быстро освоить методы работы этих инструментов.

После краткого ознакомления с инструкциями ACCESS и SQL давайте приступим к практике анализа данных ACCESS!

2. Практика анализа данных ACCESS

Следующая таблица является исходным файлом анализа данных ACCESS в этой статье. Объем данных составляет почти 230 МБ. Excel нужно подождать несколько минут, чтобы открыть, и это зависит от настроения компьютера . В целях коммерческой конфиденциальности в этой статье будут использоваться некоторые данные для анализа и работы, а также Сделайте некоторую обработку.

Как Установить в Эксель Анализ Данных • Исходные данные

Исходный вопрос данных экспортируется в фоновом режиме

Сначала импортируйте файл в Excel в ACCESS, как показано стрелкой на рисунке ниже:

 excel , Access ?

Импортировать заголовок файла первичных данных Excel

После выполнения описанных выше шагов автоматически генерируется первичный ключ (т. Е. Идентификатор) и получается следующий результат:

 excel , Access ?

Файл исходных данных Excel, импортированный в заголовок ACCESS

2. Анализ времени заказа пользователя

Для анализа периода времени для размещения заказа необходимо преобразовать время, когда пользователь разместил заказ, в час «время». Используемый здесь оператор SQL — это формат, а функция — форматировать выбранное поле. Синтаксис:

Среди них «формат данных» обычно выбирает H (час), D (день), M (месяц) или Y (год) во времени.

Затем используйте функцию подсчета для подсчета идентификатора пользователя, и результатом будет количество заказа.

Обратите внимание, что после использования формата и количества необходимо использовать «AS», чтобы определить его как новое поле, здесь определяются как «период времени» и «количество заказа».

 excel , Access ?

Шаги для анализа заказа

Создайте новый «Query Design» в «Create», нажмите «SQL» в правом нижнем углу, а затем введите следующий оператор в диалоговом окне SQL:

Формат SELECT (время заказа, «ч») AS период, количество (UserID) количество заказа AS

ОТ метаданных

Формат GROUP BY (время заказа, «ч»);

Затем нажмите «Выполнить» в разделе «Дизайн», чтобы получить следующий результат:

 excel , Access ?

Распределение заказов в разные периоды

3. Анализ распределения заказов в диапазоне оплаты

Чтобы вычислить интервал оплаты, вам нужно использовать функцию, которая сравнивает X-Switch для крупного рогатого скота, которая должна вычислять последовательность выражений в последовательности, и, если определенное выражение истинно, оно возвращает свое последующее значение.

ПЕРЕКЛЮЧАТЕЛЬ (условие 1, результат 1, условие 2, результат 2, условие 3, результат 3, . условие N, результат N)

Условие 1, Условие 2 и Условие 3: представляют вычисляемое выражение.Если Условие 1 истинно, возвращаемое значение результата 1, если Условие 2 истинно, возвращаемое значение результата 2 и т. Д.

В соответствии с описанным выше способом создайте «Дизайн запроса» в «Создать», нажмите «SQL» в правом нижнем углу и введите следующую инструкцию:

ВЫБЕРИТЕ ИД пользователя, сумму платежа, переключатель (сумма платежа

Сумма платежа

Сумма платежа

Сумма платежа

Сумма платежа

Оплата> 150, «151 ~ 220 юаней»), как диапазон потребления

ОТ метаданных;

После нажатия «Выполнить» получаются следующие результаты:

 excel , Access ?

Вопрос об интервале потребления, соответствующий сумме потребления одного заказа, размещенного целевым пользователем

В настоящее время обработка данных в интервале потребления еще не завершена, поскольку это интервал потребления, соответствующий сумме оплаты каждой записи заказа. Далее мы собираемся аналогично практике сводной таблицы в Excel, в которой интервал потребления помещается в первый столбец, чтобы подсчитать количество заказов в каждом интервале потребления.

Таким образом, как и выше, необходимо создать новый запрос, а имя изменить на «Статистика количества заказов в диапазоне платежей».

ВЫБЕРИТЕ диапазон потребления, количество (UserID) AS количество заказа

ОТ платежного интервала

Диапазон потребления GROUP BY;

 excel , Access ?

Распределение заказов в различных областях потребления

Затем скопируйте вышеуказанные данные в таблицу Excel и создайте следующую процентную веерную диаграмму, которая может интуитивно анализировать пропорцию заказов в каждом интервале потребления, а затем посмотреть, каков общий уровень потребления пользователями. Разумная оценка операции.

 excel , Access ?

Фан-график доли заказов в каждой области потребления

4. Анализ количества заказов, количества пользователей и объема продаж по регионам

Создайте новый «дизайн запроса» и назовите его «частота потребления пользователями». Введите следующий оператор в диалоговом окне SQL:

ВЫБЕРИТЕ UserID, COUNT (UserID) AS время потребления, регион

ОТ метаданных

GROUP BY UserID, площадь;

 excel , Access ?

Таблица частот пользовательских заказов

Таким образом, мы можем использовать эту таблицу частот потребления в качестве трамплина для расчета количества пользователей в каждой области во вновь создаваемой таблице.

Создайте новый «дизайн запроса» и назовите его «количество пользователей в каждой области». Введите следующий оператор в диалоговом окне SQL:

Область SELECT, count (UserID) AS общее количество пользователей

ОТ пользовательской частоты

GROUP BY область;

 excel , Access ?

Количество пользователей по регионам

(2) Статус заказов и объемов потребления в различных регионах

Создайте новый «Дизайн запроса» и назовите его «Статус заказа по регионам». Введите следующий оператор в диалоговом окне SQL:

Поле SELECT, count (UserID) AS общее количество заказов, сумма (оплата) AS общая сумма, avg (оплата) AS средняя сумма потребления

ОТ метаданных

GROUP BY область;

 excel , Access ?

Статус заказов и объемов потребления по регионам

Затем интегрируйте количество пользователей в вышеуказанных регионах в эту таблицу, чтобы получить полный обзор работы этих трех регионов. Смотрите таблицу ниже:

 excel , Access ?

Обзор региональных операций

Анализ потребительской ценности здесь основан на модели RFM, но он был дополнительно улучшен. На основе первоначального «совокупного объема потребления» введены три «минимальный объем потребления», «максимальный объем потребления» и «средний объем потребления». Этот показатель стремится полностью отражать покупательскую способность потребителей.

Создайте новый «Дизайн запроса» и назовите его «Потребление пользователя». Введите следующий оператор в диалоговом окне SQL:

ВЫБЕРИТЕ userID, min (сумма платежа) AS минимальная сумма потребления,

max (сумма платежа) AS максимальная сумма потребления,

avg (оплата) AS средняя сумма потребления,

сумма (оплата) как общая сумма потребления,

рассчитать (оплатить) AS частоту потребления,

datediff («d», max (дата размещения заказа), # 2015-9-15 #) AS количество дней с момента последнего потребления

ОТ метаданных

GROUP BY userID;

 excel , Access ?

Таблица анализа пользовательских значений

После получения таблицы вы можете выполнить кластерный анализ и классифицировать пользователей в соответствии с тремя измерениями R, F и M. Подробнее см. В разделе «[Практика обработки данных] Как использовать анализ данных для выполнения проекта пробной операции» «Нет тупика» обзор? »Эта статья.

Наконец, мы также можем получить общий объем заказов и продаж в этих трех регионах:

Создайте новый «Дизайн запроса» и назовите его «Обзор продаж по регионам». Введите следующий оператор в диалоговом окне SQL:

 excel , Access ?

Обзор продаж в трех регионах

Вывод

Как видно из вышеприведенного случая, если операторы SQL используются немного более умело, ACCESS не будет уступать Excel в обработке данных, и его сильной стороной является обработка больших объемов данных.

Интеллектуальная рекомендация

Операции с каталогами

[size = x-small;] Каталог — это структура данных, которая хранится на диске и состоит из множества записей каталога. Каждая запись каталога описывает запись в другой каталог или файл. Роль каталога за.

критерии для нумерации запросов

Введите несколько часто используемых библиотек jQuery

zeptojs Zepto — это легкая библиотека JavaScript для современных продвинутых браузеров, которая имеет API, схожие с jquery Если вы можете использовать jquery, то вы также будете использовать zepto. Не.

Как Установить в Эксель Анализ Данных • Исходные данные

Высокоточное ПО для моделирования динамики полета с неподвижным крылом / ротором — FlightSIM / HeliSIM

очертание FlightSIM / HeliSIM — это отраслевое стандартное решение для создания высокоточных симуляторов динамики полета с неподвижным крылом / ротором. FlightSIM / HeliSIM — от создания и оценки суще.

База данных автоматически генерирует индивидуальные номера заказов

База данных SQL Server автоматически генерирует индивидуальные номера заказов База данных Access автоматически генерирует пользовательские номера заказов (модуль пользовательских ф.

эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
По сравнению со сводной таблицей возможностей у функции ВПР гораздо меньше, зато, во-первых, с ней могут работать все пользователи Excel, а во-вторых, в случае необходимости перенастроить данные бизнес-отчетов, созданных на основе ВПР, получится гораздо быстрее и проще, чем если бы отчеты были созданы на основе сводных таблиц. Если же вы хотите что-то уточнить, обращайтесь ко мне!
Для начала работы с функцией ВПР ставим курсор в выбранную ячейку конечной таблицы и с помощью мастера функций выбираем значение ВПР — откроется диалоговое окно, в котором можно выбрать параметры исходной таблицы (рис. 2).
Как Установить в Эксель Анализ Данных • Исходные данные

Бизнес-аналитика в Excel: формируем и визуализируем данные

Для задачи определения зависимости количества уволившихся работников от средней зарплаты на 6 предприятиях модель регрессии имеет вид уравнения Y = а + а1x1 +…+аkxk, где хi — влияющие переменные, ai — коэффициенты регрессии, a k — число факторов.

10 основных функций Microsoft Excel для анализа данных

Microsoft Excel предлагает пользователям сотни различных функций и формул для самых разных целей. Если вам нужно проанализировать свои личные финансы или любой большой набор данных, это функции, которые облегчают работу. Кроме того, это экономит много времени и усилий. Однако найти правильную функцию для вашего набора данных может быть очень сложно.

Итак, если вы изо всех сил пытались найти подходящую функцию Excel для анализа данных, то вы попали в нужное место. Вот список некоторых основных функций Microsoft Excel, которые вы можете использовать для анализа данных и повысить свою производительность в этом процессе.

Примечание. Для непосвященных: функции, упомянутые в этом посте, необходимо добавить в строку формул электронной таблицы Excel, содержащей данные, или в ячейку, в которой вы хотите получить результат.

СЦЕПИТЬ

В приведенном выше примере я хотел, чтобы месяц и продажи были вместе в одном столбце. Для этого я использовал формулу = СЦЕПИТЬ (A2, B2) в ячейке C2, чтобы получить в результате 700 долларов США.

Формула: = СЦЕПИТЬ (ячейки, которые вы хотите объединить)

ЛЕН

В приведенном выше примере я хотел подсчитать цифры количества просмотров, которые я получал каждый месяц. Для этого я использовал формулу =LEN(C2) в ячейке D2, чтобы получить в результате 5.

ВПР

В приведенном выше примере я хотел посмотреть количество просмотров в определенном месяце. Для этого я использовал формулу = ВПР («Июнь», A2: C13, 3) в ячейке G4 и в результате получил 74992. Здесь «Июнь» — это значение поиска, A2:C13 — это массив таблиц, в котором я ищу «Июнь», а 3 — это номер столбца, в котором формула найдет соответствующие представления для июня.

Единственным недостатком использования этой функции является то, что она работает только с данными, которые были организованы в столбцы, отсюда и название — вертикальный поиск. Итак, если ваши данные расположены в строках, вам сначала нужно преобразовать строки в столбцы.

ИНДЕКС/СООТВЕТСТВИЕ

Если вы хотите найти приблизительное совпадение, вам придется заменить 0 на 1 или -1. Таким образом, 1 найдет наибольшее значение, меньшее или равное искомому значению, а -1 найдет наименьшее значение, меньшее или равное искомому значению. Обратите внимание, что если вы не используете 0, 1 или -1, формула будет использовать 1, by.

Теперь, если вы не хотите жестко указывать название месяца, вы можете заменить его номером ячейки. Таким образом, мы можем заменить «Jan» в формуле, упомянутой выше, на F3 или A2, чтобы получить тот же результат.

Формула: =ИНДЕКС(столбец данных, которые вы хотите вернуть, MATCH (общая точка данных, которую вы пытаетесь сопоставить, столбец другого источника данных, который имеет общую точку данных, 0))

МИНИ-/МАКСИФ

=MINIFS и =MAXIFS очень похожи на функции =MIN и =MAX, за исключением того факта, что они позволяют вам взять минимальный/максимальный набор значений и также сопоставить их по определенным критериям. По сути, функция ищет минимальное/максимальное значение и сопоставляет его с входными критериями.

В приведенном выше примере я хотел найти минимальные баллы в зависимости от пола учащегося. Для этого я использовал формулу =MINIFS (C2:C10, B2:B10, «M») и получил результат 27. Здесь C2:C10 — столбец, в котором формула будет искать баллы, B2:B10 — столбец, в котором формула будет искать критерии (пол), а «M» — это критерии.

Точно так же для получения максимальных баллов я использовал формулу =МАКСЕСЛИ(C2:C10, B2:B10, «M») и получил результат 100.

Формула для МИНИФС: =МИНИФС(минимальный_диапазон, диапазон_критериев1, критерий1,…)

Формула для МАКСЕСЛИ: =МАКСЕСЛИ(максимальный_диапазон, диапазон_критериев1, критерий1,…)

СРЕДНИЕ

В этом примере я хотел найти средний балл в зависимости от пола учащихся. Для этого я использовал формулу =СРЗНАЧЕСЛИМН(C2:C10, B2:B10, «M») и в результате получил 56,8. Здесь C2:C10 — это диапазон, в котором формула будет искать среднее значение, B2:B10 — это диапазон критериев, а «M» — это критерии.

Формула: =СРЗНАЧЕСЛИ(средний_диапазон, критерий_диапазон1, критерий1,…)

СЧЁТЕСЛИ

Теперь, если вы хотите подсчитать количество случаев, когда набор данных соответствует определенным критериям, вам нужно использовать функцию =COUNTIFS. Эта функция позволяет добавлять в запрос неограниченное количество критериев и, таким образом, упрощает поиск числа на основе входных критериев.

В этом примере я хотел найти количество студентов мужского и женского пола, получивших проходные баллы (т.е. >=40). Для этого я использовал формулу =СЧЁТЕСЛИМН(B2:B10, «M», C2:C10, «>=40»). Здесь B2:B10 — диапазон, в котором формула будет искать первые критерии (пол), «M» — первые критерии, C2:C10 — диапазон, в котором формула будет искать вторые критерии (оценки), и «>=40» — второй критерий.

СУММПРОДУКТ

Функция =СУММПРОИЗВ помогает перемножать диапазоны или массивы вместе, а затем возвращает сумму произведений. Это довольно универсальная функция, и ее можно использовать для подсчета и суммирования массивов, таких как СЧЁТЕСЛИМН или СУММЕСЛИМН, но с дополнительной гибкостью. Вы также можете использовать другие функции в SUMPRODUCT, чтобы еще больше расширить его функциональность.

В этом примере я хотел найти общую сумму всех проданных товаров. Для этого я использовал формулу =СУММПРОИЗВ(B2:B8, C2:C8). Здесь B2:B8 — первый массив (количество проданных товаров), а C2:C8 — второй массив (цена каждого товара). Затем формула умножает количество каждого проданного продукта на его цену, а затем складывает все это, чтобы получить общий объем продаж.

ОТДЕЛКА

Функция =TRIM особенно полезна при работе с набором данных, содержащим несколько пробелов или нежелательных символов. Эта функция позволяет с легкостью удалять эти пробелы или символы из ваших данных, что позволяет получать точные результаты при использовании других функций.

В этом примере я хотел удалить все лишние пробелы между словами Mouse и pad в A7. Для этого я использовал формулу =TRIM(A7).

Формула просто удалила лишние пробелы и выдала результат Коврик для мыши с одним пробелом.

НАЙТИ/ПОИСК

Завершают все функции НАЙТИ/ПОИСК, которые помогут вам выделить конкретный текст в наборе данных. Обе функции очень похожи в том, что они делают, за исключением одного важного отличия — функция =НАЙТИ возвращает только совпадения с учетом регистра. Между тем функция =ПОИСК таких ограничений не имеет. Эти функции особенно полезны при поиске аномалий или уникальных идентификаторов.

В этом примере я хотел найти количество раз, когда «Gui» появлялся в Guiding Tech, для чего я использовал формулу = НАЙТИ (A2, B2), которая дала результат 1. Теперь, если бы я хотел найти количество раз ‘ gui’ вместо этого появился в Guiding Tech, мне пришлось бы использовать формулу =ПОИСК, потому что она не чувствительна к регистру.

Формула поиска: =НАЙТИ(найти_текст, внутри_текста, [start_num])

Формула поиска: =ПОИСК(найти_текст, внутри_текста, [start_num])

Овладейте анализом данных

Эти основные функции Microsoft Excel, безусловно, помогут вам в анализе данных, но этот список — лишь верхушка айсберга. Excel также включает в себя несколько других расширенных функций для достижения определенных результатов. Если вы хотите узнать больше об этих функциях, сообщите нам об этом в разделе комментариев ниже.

Далее: если вы хотите использовать Excel более эффективно, вам следует ознакомиться со следующей статьей, чтобы узнать о некоторых удобных сочетаниях клавиш для навигации в Excel, которые вы должны знать.

эксперт
Мнение эксперта
Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft
Если у вас возникнут сложности, я помогу разобраться!
Задать вопрос эксперту
Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого момента времени t. Если же вы хотите что-то уточнить, обращайтесь ко мне!
В результате выполненных действий в нижней части меню Сер­вис появится новая команда Анализ данных. Эта команда предостав­ляет доступ к средствам анализа, которые есть в Excel.

Пример выполнения задания с помощью пакета анализа Excel

Ещё один важный показатель расположен в ячейке на пересечении строки «Y-пересечение» и столбца «Коэффициенты». Тут указывается какое значение будет у Y, а в нашем случае, это количество покупателей, при всех остальных факторах равных нулю. В этой таблице данное значение равно 58,04.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector