Поправка Шидака для t-теста - Šidák correction for t-test

Одно из приложений T-тест Стьюдента состоит в том, чтобы проверить расположение одной последовательности независимые и одинаково распределенные случайные величины. Если мы хотим проверить расположение нескольких последовательностей таких переменных, Поправка Шидака следует применять для калибровки уровня t-критерия Стьюдента. Более того, если мы хотим проверить расположение почти бесконечного числа последовательностей переменных, следует использовать поправку Шидака, но с осторожностью. В частности, достоверность поправки Шидака зависит от того, насколько быстро число последовательностей стремится к бесконечности.

Вступление

Предположим, нас интересует м разные гипотезы, , и хотел бы проверить, все ли они верны. Теперь схема проверки гипотез становится

: все верны;
: хотя бы один из ложно.

Позволять быть уровнем этого теста (ошибка типа I), то есть вероятностью того, что мы ошибочно отвергаем когда это правда.

Мы стремимся разработать тест определенного уровня .

Предположим, при проверке каждой гипотезы , мы используем тестовую статистику .

Если эти независимы, то тест на может быть разработан с помощью следующей процедуры, известной как коррекция Шидака.

Шаг 1, мы тестируем каждый из м нулевые гипотезы на уровне .
Шаг 2, если любой из них м нулевые гипотезы отклоняются, мы отклоняем .

Конечный случай

Предположим, что для конечного числа t-критериев где для каждого я, независимо и одинаково распределены, для каждого j независимы, но не обязательно одинаково распределены, и имеет конечный четвертый момент.

Наша цель - разработать тест для с уровнем α. Этот тест может быть основан на t-статистика каждой последовательности, то есть

куда:

Используя поправку Шидака, мы отклоняем если какой-либо из t-тестов, основанных на t-статистике выше, отклоняется на уровне В частности, мы отклоняем когда

куда

Определенный выше тест имеет асимптотический уровень α, потому что

Бесконечный случай

В некоторых случаях количество последовательностей, , увеличиваться по мере увеличения размера данных каждой последовательности, , увеличивать. В частности, предположим . Если это правда, то нам нужно будет проверить нуль, включая бесконечное множество гипотез, то есть

Чтобы разработать тест, Поправка Шидака может применяться, как и в случае конечного числа t-критерия. Однако когда , поправка Шидака для t-критерия может не достичь желаемого уровня, то есть истинный уровень теста может не сходиться к номинальному уровню когда n стремится к бесконечности. Этот результат связан с многомерная статистика и доказано Fan, Hall and Yao (2007).[1] В частности, если мы хотим, чтобы истинный уровень теста сходился к номинальному уровню , то нам нужно ограничить скорость . В самом деле,

  • Когда все имеют симметричное относительно нуля распределение, то достаточно потребовать чтобы гарантировать, что истинный уровень сходится к .
  • Когда раздачи асимметричны, то необходимо наложить чтобы истинный уровень сходился к .
  • Собственно, если мы применим самонастройка метод калибровки уровня, тогда нам понадобится только даже если имеет асимметричное распределение.

Приведенные выше результаты основаны на Центральная предельная теорема. Согласно Центральной предельной теореме каждая из наших t-статистик обладает асимптотическим стандартным нормальным распределением, поэтому разница между распределением каждого и стандартное нормальное распределение асимптотически пренебрежимо. Вопрос в том, суммируем ли мы все различия между распределением каждого и стандартное нормальное распределение, эта совокупность различий все еще асимптотически игнорируется?

Когда у нас есть конечное количество , ответ - да. Но когда у нас бесконечно много , некоторое время ответ будет отрицательным. Это потому, что в последнем случае мы суммируем бесконечно много бесконечно малых членов. Если количество членов слишком быстро стремится к бесконечности, то есть слишком быстро, тогда сумма не может быть равна нулю, распределение t-статистики не может быть аппроксимировано стандартным нормальным распределением, истинный уровень не сходится к номинальному уровню , а затем коррекция Шидака не срабатывает.

Смотрите также

Примечания

  1. ^ Фань, Цзяньцин; Холл, Питер; Яо, Цивэй (2007). "Сколько одновременных проверок гипотез можно применить к нормальному, t-тесту Стьюдента или калибровке начальной загрузки ". Журнал Американской статистической ассоциации. 102 (480): 1282–1288. arXiv:математика / 0701003. Дои:10.1198/016214507000000969.CS1 maint: ref = harv (связь)

Рекомендации