Статистические гипотезы

Вообще говоря, что такое статистическая гипотеза не сложно найти в учебниках по математической статистике, теории случайных процессов или теории вероятностей. Однако, эту тему стоит затронуть, чтобы было понятно в последующем то, о чем я пишу.

И так, постараюсь ясно и кратко изложить суть вопросов.

Статистическая гипотеза (СГ) – это определённое предположение о распределении вероятностей значений ВР или о неизвестных параметрах ВР, который мы исследуем.

Различают сложные и простые СГ. Простые гипотезы содержат единственное предположение (например, что значения ВР подчиняются нормальному закону распределения). Сложные гипотезы состоят, как правило, из несколько простых.

На практике, как правило, требуется проверить какую-то конкретную, как правило, простую СГ. Её обозначают H0 и называют нулевой СГ. При этом параллельно рассматривается альтернативная или, иными словами, конкурирующая СГ H1.

Так как проверка гипотез основывается на статистических методах – гипотезы называют статистическими.

Проверка СГ – это процесс принятия решения о том, противоречит ли рассматриваемая СГ тому, что есть на самом деле.

Например, мы выдвигаем СГ H0 о том, что значения ВР распределены нормально. За тем проверяем эту гипотезу и по результатам проверки принимаем решение принять её или отвергнуть, т.к. есть признаки, что значения ВР распределены ненормально (как-то иначе).

Для проверки СГ будем использовать статистические тесты (или иначе статистические критерии, что тоже самое) – строгое математическое правило, по которому принимается или отвергается СГ.

При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:

– можно отвергнуть нулевую СГ, когда она на самом деле верна (ошибка первого рода);

– можно принять нулевую СГ, когда она на самом деле не верна (ошибка второго рода).

Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок (об этом можно найти в Интернет, писать здесь не имеет большого смысла).

При проверке СГ с помощью тестов задают уровень значимости. Уровень значимости α – это вероятность ошибки, в случае отклонения СГ H0 (обычно устанавливают этот параметр в 5-10%, какого-то конкретного способа нет). Я решил всегда устанавливать его в 5%, т.е. α=0.05.

Таким образом, задачу проверки нулевой СГ H0 можно представить в виде следующей последовательности действий:

  1. Задать гипотезу H0.
  2. Решить какой статистический тест для проверки СГ H0 применить.
  3. Определить уровень значимости α для статистического теста.
  4. Взять выборку ВР, которую нужно протестировать.
  5. Провести статистический тест и получить некоторые результаты. Как правило это два значения. Первое – это значение, рассчитанное по математической формуле для соответствующего теста, обозначается оно по-разному для каждого теста. Второе значение – это значение «правдоподобия» того, что проверяемый ВР соответствует нашей гипотезе. Это значение называется p-значение или p-value.
  6. Принять или отвергнуть СГ H0. Данную гипотезу принимают, если значение теста меньше критического. Критическое значение смотрят в таблице или рассчитывают отдельно. Иначе гипотезу отвергают. Также принять или отвергнуть гипотезу помогает значение p-value. Чем больше значение p-value, тем больше уверенности в том, что ВР соответствует СГ. Обычно гипотеза не отклоняется, если p-value больше 10%. Если меньше 1% – гипотеза отклоняется. Если между 1% и 10% – ситуация неопределенности и нужно проводить дополнительные тесты.

Вот так, если вкратце. В следующий раз я планирую провести какой-нибудь статистический тест (какой ещё не решил) для проверки нормальности распределения приращений логарифмов валютного рынка.

Похожие статьи:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *