Пакет инструментов анализа в Excel

Автор: | 02.06.2022

Пакет инструментов анализа данных Excel

Data Analysis Toolkit в Excel — это надстройка в Excel, которая позволяет нам выполнять анализ данных и различные другие важные вычисления, эта надстройка не включена в Excel по умолчанию, и мы должны вручную включить ее на вкладке файлов в параметрах и затем в разделе «Надстройки» нажмите «Управление надстройками», а затем проверьте, можно ли использовать Analysis Toolkit в Excel.

Шаги по загрузке надстройки Data Analysis Toolpak

  • Шаг 1: Нажмите «Файл.’

 

  • Шаг 2 – Нажмите «Параметры» в списке.

 

  • Шаг 3. Нажмите «Надстройки», а затем выберите «Надстройки Excel» для «Управление». Нажмите «Перейти.’

 

  • Шаг 4. В разделе «Надстройки Excel» появится диалоговое окно со списком надстроек. Установите флажок «Инструменты анализа» и нажмите «ОК.’

 

  • Шаг 5. Команда «Анализ данных» появится на вкладке «Данные» в Excel в правой части ленты, как показано ниже.

 

Список функций, доступных в пакете инструментов анализа данных Excel

Ниже приведен список функций, доступных в надстройке Excel Toolpak для анализа:

  1. ANOVA: одномерный анализ в Excel
  2. Корреляция в Excel
  3. Ранг и процентиль в Excel
  4. Описательная статистика в Excel

Теперь давайте подробно разберем каждый из них —

# 1 — ANOVA: однофакторный анализ в Excel

Дисперсионный анализ (дисперсионный анализ) — это первый набор параметров, доступных в надстройке Excel Toolpak для анализа. В однофакторном дисперсионном анализе мы проверяем, существуют ли статистические различия между средними значениями трех или более независимых групп. Нулевая гипотеза предполагает отсутствие статистической значимости в наборе данных наблюдений. Мы проверили эту гипотезу, проверив p-значение.

Давайте разберемся с этим на примере ANOVA excel.

 

пример

Допустим, у нас есть следующие данные эксперимента, проведенного для проверки: «Возможно ли восстановить самообладание в состоянии алкогольного опьянения?» Делим 44 человека на 4 равные группы по 11 человек в каждой.

  • Группа А получила 0,62 мг/кг алкоголя.
  • Группа AC получала алкоголь плюс кофеин.
  • Группа AR получила алкоголь и денежное вознаграждение за выступление.
  • Группа П получала плацебо.

Баллы фиксировались за выполнение основного задания награды, которое включает в себя «управляемые (требующие усилий) процессы памяти», и результат был следующим:

 

Нам нужно проверить нулевую гипотезу о том, что все средние равны (нет существенной разницы).

 

Как провести тест ANOVA?

Чтобы запустить односторонний тест ANOVA, нам нужно выполнить следующие шаги:

  • Шаг 1: Нажмите на команду «Анализ данных», доступную на вкладке «Данные» в разделе «Анализ.’

 

  • Шаг 2: Выберите «Anova: Single Factor» из списка и нажмите «ОК.’

 

  • Шаг 3: У нас появилось диалоговое окно «Anova: Single Factor». Нам нужно выбрать диапазон ввода как данные с заголовком столбца.

 

  • Шаг 4 — Поскольку мы берем заголовки столбцов в нашем выборе, нам нужен флажок «Ярлыки в первой строке».

 

  • Шаг 5: Мы выбираем F1 для выходного диапазона. Нажмите «ОК.’

 

Теперь у нас есть анализ ANOVA.

 

Чем больше значение F-статистики в Excel, тем больше вероятность того, что группы будут иметь разные средние значения, тем самым отвергая нулевую гипотезу о том, что все средние равны. Статистика F, превышающая критическое значение, эквивалентна p-значению Excel, меньшему, чем альфа, и оба значения означают, что мы отвергаем нулевую гипотезу. Отсюда можно сделать вывод о существенной разнице между группами.

# 2 — Корреляция в Excel

Корреляция — это статистическая мера, доступная в пакете инструментов Excel для анализа, которая показывает степень, в которой две или более переменных колеблются вместе. Положительная корреляция в Excel указывает на степень, в которой эти переменные увеличиваются или уменьшаются параллельно. Отрицательная корреляция указывает на степень увеличения одной переменной при уменьшении другой.

Вы можете скачать этот шаблон Excel ToolPak здесь — Шаблон анализа Excel ToolPak

пример

У нас есть следующие данные, касающиеся расходов на рекламу и продаж компании. Мы хотим выяснить взаимосвязь между ними, чтобы мы могли соответствующим образом планировать наш бюджет и прогнозировать продажи (установить цель, учитывая и другие факторы).

 

Как найти корреляцию между двумя наборами переменных?

Чтобы выяснить корреляцию между этими двумя наборами переменных, мы выполним следующие шаги:

  • Шаг 1. Нажмите «Анализ данных» в группе «Анализ» в разделе «Данные.’

 

  • Шаг 2. Выберите «Сопоставление» из списка и нажмите «ОК.’

 

  • Шаг 3: Выберите диапазон «$A$1:$B$16» в качестве входного диапазона и $F$1 в качестве выходного диапазона. Установите флажок «Ярлыки в первой строке», потому что у нас есть заголовки столбцов в нашем диапазоне ввода и потому что у нас есть разные заголовки в другом столбце. Выберите «Столбцы» для «Группировать по».

 

  • Шаг 4. Выберите выходной диапазон и нажмите «ОК».

 

  • Получаем результат.

 

Как мы видим, корреляция между стоимостью рекламы (заголовок столбца) и продажами (заголовок строки) составляет примерно +0,86274, что указывает на положительную корреляцию 86,27%. Теперь мы можем определиться с рекламным бюджетом и ожидаемыми продажами соответственно.

# 3 — Рейтинг и процентиль в Excel

Процентиль в Excel — это число, на которое определенный процент оценок ниже этого числа, и которое доступно для анализа в надстройке Excel Toolpak. Например, если определенный балл находится в 90-м процентиле, это означает, что учащийся набрал более 90% баллов от людей, сдавших тест. Давайте разберемся с этим на примере.

пример

У нас есть следующие данные об оценках, полученных учеником в классе.

 

Мы хотим знать ранг и процентиль каждого студента.

Как найти ранг и процентиль?

Шаги будут такими:

  • Шаг 1. Нажмите «Анализ данных» в группе «Анализ» в разделе «Данные.’

 

  • Шаг 2: Нажмите «Рейтинг и процентиль» в списке, а затем нажмите «ХОРОШО.’

 

  • Шаг 3: Выберите «$B$1:B$B$17» в качестве входного диапазона и «$D$1» в качестве выходного диапазона.

 

  • Шаг 4. Поскольку у нас есть заголовки полей данных в столбцах, то есть данные сгруппированы по столбцам, нам нужно выбрать «Столбцы» для «Группировать по».

 

  • Шаг 5: Мы выбрали заголовок столбца в нашем диапазоне ввода; поэтому нам нужно проверить «Ярлыки в первой строке», а затем нажать «ОК».

 

  • Мы получили результат, как на следующем изображении.

 

# 4 — Описательная статистика в Excel

Описательная статистика, включенная в надстройку Excel Toolpak for Analytics, содержит следующую информацию:

  1. Основная тенденция
    1. Значение: это называется средним.
    2. Медиана: это середина распределения.
    3. Мода: это число, которое встречается чаще всего.
  2. Меры изменчивости
    1. Спектр: это разница между самой большой и самой маленькой переменной.
    2. Разница: Это показало, насколько далеко друг от друга числа.
    3. Стандартное отклонение: Насколько велико отклонение от среднего/среднего значения.
  3. Асимметрия: показывает, насколько симметрично распределение переменной.
  4. Эксцесс: это указывает на пик или плоскость распределения.
пример

Ниже представлены оценки, полученные студентами по предмету «Экономика». Нам нужна описательная статистика.

 

Чтобы сделать то же самое, выполните следующие действия:

  • Шаг 1: Нажмите команду «Анализ данных», доступную в группе «Анализ» в разделе «Данные.’

 

  • Шаг 2. Выберите «Описательная статистика» из списка и нажмите «ОК.’

 

  • Шаг 3: выберите «1 доллар США: 15 австралийских долларов» в качестве диапазона ввода, выберите «Столбцы» для «Группировать по», установите флажок «Теги в первой строке»,

 

  • Шаг 4: Выберите «$ C $ 1» в качестве выходного диапазона и обязательно установите флажок «Сводная статистика». Нажмите ОК».

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *