Anonim

Поначалу теория p- значений и нулевая гипотеза могут показаться сложными, но понимание концепций поможет вам ориентироваться в мире статистики. К сожалению, в научно-популярной науке эти термины часто неправильно используются, поэтому всем было бы полезно понять основы.

Также смотрите нашу статью Как удалить все остальные строки в Excel

Вычисление p- значения модели и подтверждение / опровержение нулевой гипотезы на удивление просто в MS Excel. Есть два способа сделать это, и мы рассмотрим оба из них. Давайте копаться в.

Нулевая гипотеза и р- значение

Нулевая гипотеза - это утверждение, также называемое позицией по умолчанию, которая утверждает, что взаимосвязь между наблюдаемыми явлениями не существует. Это также может быть применено к ассоциациям между двумя наблюдаемыми группами. Во время исследования вы проверяете эту гипотезу и пытаетесь опровергнуть ее.

Например, скажем, вы хотите наблюдать, имеет ли конкретная причудливая диета значительные результаты. В этом случае нулевая гипотеза состоит в том, что нет существенной разницы в весе испытуемых до и после диеты. Альтернативная гипотеза состоит в том, что диета имела значение. Это то, что исследователи будут пытаться доказать.

Значение p представляет вероятность того, что статистическая сводка будет равна или больше наблюдаемого значения, когда нулевая гипотеза верна для определенной статистической модели. Хотя это часто выражается в виде десятичного числа, как правило, лучше выражать его в процентах. Например, р- значение 0, 1 должно быть представлено как 10%.

Низкое p- значение означает, что доказательства против нулевой гипотезы являются сильными. Это также означает, что ваши данные значимы. С другой стороны, высокое p- значение означает, что нет веских доказательств против этой гипотезы. Чтобы доказать, что причудливая диета работает, исследователям необходимо найти низкое значение p .

Статистически значимым результатом является тот, который вряд ли произойдет, если нулевая гипотеза верна. Уровень значимости обозначается греческой буквой альфа, и он должен быть больше значения p, чтобы результат был статистически значимым.

Многие исследователи в самых разных областях используют значение p, чтобы лучше и глубже понять данные, с которыми они работают. Некоторые из известных областей включают социологию, уголовное правосудие, психологию, финансы и экономику.

Нахождение p- значения в Excel

Вы можете найти p- значение набора данных в MS Excel с помощью функции T-Test или с помощью инструмента анализа данных. Сначала мы рассмотрим функцию T-Test. Мы рассмотрим пять студентов колледжа, которые придерживались 30-дневной диеты. Мы сравним их вес до и после диеты.

ПРИМЕЧАНИЕ. Для целей этой статьи мы будем использовать MS Excel 2010. Хотя это и не самая последняя версия, эти действия обычно следует применять и к более новым версиям.

Функция Т-теста

Выполните следующие шаги для вычисления p- значения с помощью функции T-Test.

  1. Создайте и заполните таблицу. Наш стол выглядит так:

  2. Нажмите на любую ячейку за пределами вашего стола.
  3. Введите: = T.Test (.
  4. После открытой скобки введите первый аргумент. В этом примере это столбец «Перед диетой». Диапазон должен быть B2: B6. Пока что функция выглядит так: T.Test (B2: B6.
  5. Далее мы введем второй аргумент. Столбец «После диеты» и его результаты являются нашим вторым аргументом, и нам нужен диапазон C2: C6. Давайте добавим это к формуле: T.Test (B2: B6, C2: C6.
  6. Введите запятую после второго аргумента, и параметры одностороннего и двухстороннего распространения автоматически появятся в раскрывающемся меню. Давайте выберем первый - односторонний дистрибутив. Дважды щелкните по нему.
  7. Введите другую запятую.
  8. Дважды щелкните по паре в следующем раскрывающемся меню.
  9. Теперь, когда у вас есть все необходимые элементы, закройте скобку. Формула для этого примера выглядит следующим образом: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Нажмите Ввод. В ячейке немедленно отобразится значение p . В нашем случае это значение составляет 0, 133906 или 13, 3906%.

Будучи выше 5%, это p- значение не дает убедительных доказательств против нулевой гипотезы. В нашем примере, исследование не доказало, что диета помогла испытуемым потерять значительное количество веса. Это не обязательно означает, что нулевая гипотеза верна, только то, что она еще не опровергнута.

Маршрут анализа данных

Инструмент «Анализ данных» позволяет делать много интересных вещей, включая вычисления с p- значением. Чтобы упростить ситуацию, мы будем использовать ту же таблицу, что и в предыдущем методе.

Вот как это делается.

  1. Поскольку у нас уже есть разница в весе в столбце D, мы пропустим вычисление разницы. Для будущих таблиц используйте эту формулу: = «Ячейка 1» - «Ячейка 2».
  2. Далее нажмите на вкладку «Данные» в главном меню.
  3. Выберите инструмент анализа данных.
  4. Прокрутите список вниз и выберите опцию t-Test: Парные два образца для средств.
  5. Нажмите ОК.
  6. Появится всплывающее окно. Это выглядит так:

  7. Введите первый диапазон / аргумент. В нашем примере это B2: B6.
  8. Введите второй диапазон / аргумент. В данном случае это C2: C6.
  9. Оставьте значение по умолчанию в текстовом поле Альфа (это 0, 05).
  10. Нажмите на переключатель «Выходной диапазон» и выберите, где вы хотите получить результат. Если это ячейка A8, введите: $ A $ 8.
  11. Нажмите ОК.
  12. Excel вычислит значение p и ряд других параметров. Финальная таблица может выглядеть так:

Как видите, p- значение с одним хвостом такое же, как и в первом случае - 0, 133905569. Поскольку он выше 0, 05, для этой таблицы применима нулевая гипотеза, и доказательства против нее слабы.

Что нужно знать о p- значении

Вот несколько полезных советов относительно вычислений p- значения в Excel.

  1. Если p- значение равно 0, 05 (5%), данные в вашей таблице значимы. Если оно меньше 0, 05 (5%), ваши данные очень важны.
  2. Если значение p больше 0, 1 (10%), данные в вашей таблице будут незначительными. Если он находится в диапазоне 0, 05-0, 10, у вас есть незначительно значимые данные.
  3. Вы можете изменить альфа-значение, хотя наиболее распространенными являются 0, 05 (5%) и 0, 10 (10%).
  4. Выбор двустороннего тестирования может быть лучшим выбором, в зависимости от вашей гипотезы. В приведенном выше примере одностороннее тестирование означает, что мы исследуем, потеряли ли испытуемые вес после диеты, и это именно то, что нам нужно было выяснить. Но двусторонний тест также проверил бы, набрали ли они статистически значимое количество веса.
  5. Значение p не может идентифицировать переменные. Другими словами, если он определяет корреляцию, он не может определить причины этого.

Значение р демистифицировано

Каждый статистик, достойный его или ее соли, должен знать все тонкости проверки нулевых гипотез и то, что означает p- значение. Эти знания также пригодятся исследователям во многих других областях.

Вы когда-нибудь использовали Excel для вычисления p- значения статистической модели? Какой метод вы использовали? Вы предпочитаете другой способ его расчета? Дайте нам знать в разделе комментариев.

Как рассчитать p-значение в Excel