Математический словарь

" 0 C F G H K L N P S T W Z А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Ю Я

СТАТИСТИЧЕСКИХ ГИПОТЕЗ ПРОВЕРКА

Значение СТАТИСТИЧЕСКИХ ГИПОТЕЗ ПРОВЕРКА в математической энциклопедии:

один из основных разделов математич. статистики, в к-ром развиваются идеи и методы статистич. проверки соответствия между экспериментальными данными и гипотезами об их вероятностной природе.
Пусть наблюдается случайный вектор Х= (Х ₁, . . ., X_n), принимающий значения х= (х ₁, . . ., х _п )в измеримом пространстве и пусть известно, что распределение вероятностей этого случайного вектора . принадлежит заданному множеству вероятностных распределений где - нек-рое параметрич. множество. Множество Нназ. множеством допустимых гипотез, а любое его непустое подмножество H_i - статистич. гипотезой или просто гипотезой. Если H_i содержит ровно один элемент, то такая гипотеза наз. простой, в противном случае - сложной. Далее, пусть в Нвыделены две т. н. конкурирующие между собой гипотезы

одну из к-рых, напр. H₀, наз. основной, а другую - альтернативной гипотезой или просто альтернативой к H₀. В терминах гипотез H₀ и H₁, удобно формулировав, основную задачу теории С. г. н. в рамках модели Неймана - Пирсона (см. [1], [2]). Именно, найти оптимальный способ, пользуясь к-рым можно было бы на основе наблюденной реализации случайного вектора . проверить, справедлива ли гипотеза согласно к-рой распределение вероятностей вектора X принадлежит множеству или же справедлива альтернативная гипотеза согласно к-poй распределение вероятностей наблюдаемого вектора Xпринадлежит множеству

Пример 1. Пусть наблюдается случайный вектор X=(X₁, . .., Х _п), компоненты к-рого Х ₁, . . ., Х _п суть независимые случайные величины, подчиняющиеся одному и тому же нормальному закону математич. ожидание к-рого неизвестно а дисперсия равна 1, т. е. для любого действительного числа х

В этих условиях можно, напр., рассмотреть задачу проверки гипотезы против альтернативы где - нек-рое заданное число. В данном примере гипотеза H₀ является простой, а конкурирующая с ней гипотеза H₁- сложной.
Формально, конкурирующие гипотезы H₀ и Н ₁ являются равноправными в задаче различения гипотез и вопрос о том, какое из двух непересекающихся и взаимно дополняющих множеств из Нназвать основной гипотезой, не является существенным и не влияет на построение самой теории С. г. п. Однако, как правило, на выборе основной гипотезы сказывается отношение экспериментатора к самой задаче, в результате чего основной гипотезой чаще наз. то множество H₀ из множества всех допустимых гипотез Н, к-рое, по мнению экспериментатора, но природе изучаемого явления либо из каких-либо физич. соображений, должно лучше согласовываться с ожидаемыми экспериментальными данными. Именно поэтому гипотезу Н ₀ часто наз. проверяемой гипотезой. В теоретич. плане различие между гипотезами H₀ и H₁ часто сказывается в том, что, как правило, множество H₀ оказывается более просто устроенным, чем H₁, что отражает желание экспериментатора иметь дело с более простой моделью.
В теории С. г. п. суждение о справедливости H₀ или H₁ делается на основании наблюденной реализации случайного вектора X;при этом решающее правило, с помощью к-рого принимается решение лсправедлива гипотеза наз. статистическим критерием. Структура любого статистич. критерия полностью определяется его т. н. критич. функцией Согласно статистич. критерию, имеющему критич. функцию проверяемая гипотеза H₀ отвергается с вероятностью в пользу альтернативы H_1, а гипотеза H₁ отвергается с вероятностью в пользу H₀. С практич. точки зрения наибольший интерес представляют т. н. нерандомизированные критерии, критич. функции к-рых принимают лишь два значения: 0 и 1. Какой бы критерий не применялся для различения гипотез H₀ и H₁, в результате его применения можно либо принять правильное решение, либо прийти к ошибочному. В теории С. г. п. ошибочные выводы принято классифицировать следующим образом.
Если критерий бракует проверяемую гипотезу H₀. когда она в действительности верна, то говорят, что совершена ошибка 1-го рода. Напротив, если статистич. критерий не отклоняет проверяемую гипотезу H₀ (и, значит, согласно этому критерию, гипотеза H₀ принимается), когда она на самом деле неверна, то говорят, что совершена ошибка 2-го рода. Задачу проверки гипотезы H₀ против Н ₁ желательно провести таким образом, чтобы минимизировать вероятности этих ошибок. К сожалению, управлять обеими вероятностями ошибок одновременно при фиксированной размерности пвектора наблюдений . невозможно: уменьшение одной из них ведет, как правило, к увеличению другой. Численно вероятности этих ошибок выражаются в терминах т. н. функции мощности статистич. критерия, определенной на множестве по следующему правилу:

Из определения функции мощности следует, что если случайный вектор X подчиняется закону то статистич. критерий, основанный на критич. функции будет отклонять проверяемую гипотезу H₀ с вероятностью Таким образом, сужении функции мощности на будет показывать вероятности ошибок 1-го рода, т. е. вероятности напрасного отклонения H₀. Напротив, сужение функции мощности с на называемое мощностью статистич. критерия, показывает другое важное качество статистич. критерия: вероятности отклонения проверяемой гипотезы H₀,. когда в действительности справедлива конкурирующая гипотеза H₁. Иногда мощностью статистич. критерия наз. число

Дополнение же мощности до 1, т. е. функция заданная на множестве позволяет вычислять вероятности ошибок 2-го рода.
В рамках классич. модели С. г. п. Неймана - Пирсона задачу проверки H₀ против H₁ начинают с выбора верхней границы для вероятности напрасного отклонения проверяемой гипотезы H₀, т. е. для вероятности ошибки 1-го рода, и уже при заданной границ стараются построить такой критерий, к-рый имел бы наибольшую мощность. Исходя из особой роли, к-рую играет гипотеза H₀ для экспериментатора, число наз. уровнем значимости критерия, выбирают достаточно малым, напр. равным 0,01; 0,05; 0,1 и т. п. Выбор уровня значимости означает, что множество всех статистич. критериев, предназначенных для проверки H₀ против H₁, сужается до множества критериев, удовлетворяющих условию:

(Иногда вместо условия (1) требуют, чтобы что никак не отражается на построении общей теории С. г. п.) Статистич. критерий, удовлетворяющий условию (1), наз. критерием уровня Таким образом, в классич. постановке задача проверки H₀ против Н ₁ сводится к построению такого статистич. критерия уровня функция мощности к-рого удовлетворяла бы условию

где - функция мощности произвольного критерия уровня В случае, когда гипотезы H₀ и H₁ являются простыми, эффективное решение этой вариационной задачи дает отношения правдоподобия критерий. Если же гипотеза H₁ является сложной, то статистич. критерий, удовлетворяющий условию (2), удается построить редко. Но если такой критерий существует, то именно этот критерий признается наилучшим для проверки H₀ против H₁ и его наз. равномерно наиболее мощным критерием уровня в задаче различения статистич. гипотез H₀ и H₁. В силу того что равномерно наиболее мощные критерии существуют редко, приходится сужать класс статистич. критериев с помощью нек-рых дополнительных требований, таких, как несмещенность, подобие, полнота и др., и ужо в более узком классе строить наилучший критерий в смысле (2). Напр., требование несмещенности критерия означает, что его функция мощности должна удовлетворять соотношению

Пример 2. В условиях примера 1 при любом фиксированном уровне значимости существует нерандомизированный равномерно наиболее мощный несмещенный критерий уровня для проверки H₀ против альтернативы H₁ - отношения правдоподобия критерий. Критич. функция этого наилучшего критерия определяется следующим образом:

где

В силу того что статистика X., называемая статистикой критерия, подчиняется нормальному закону с параметрами и т. е. для любого действительного числа х

функция мощности наилучшего критерия для проверки H₀ против Н ₁ выражается формулой

причем Рисунок дает графич. представление о поведении функции мощности

Наименьшее значение, равное уровню значимости функция достигает в точке и, по мере удаления от ее значения растут, приближаясь тем ближе к 1, чем больше величина
Теория С. г. п . позволяет с единой точки зрения трактовать различные задачи, выдвигаемые практикой: построение интервальных оценок для неизвестных параметров, оценка расхождения между средними значениями вероятностных законов, проверка гипотез о независимости наблюдений, задачи статистич. контроля качества и др. Так, напр., в примере 2 зона принятия гипотезы H₀ представляет собой наилучший доверительный интервал с коэффициентом доверия для неизвестного математич. ожидания
Наряду с классич. подходом Неймана - Пирсона к решению задачи различения гипотез существуют и другие: бейесонский подход, минимаксный подход, метод последовательного различения Вальда и др. Кроме того, в теории С. г. п. рассматриваются приближенные методы, основанные на изучении асимптотич. поведения последовательности функций мощности статистич. критериев, предназначенных для проверки H₀ против H₁ когда размерность пвектора наблюдений X=(X₁,. . ..Х _n) неограниченно растет. В такой ситуации обычно требуют, чтобы построенная последовательность критериев была состоятельной, т. е. чтобы

что означает, что с ростом пгипотезы H₀ и H₁ можно будет различать с любой степенью достоверности. В примере 2 построена состоятельная последовательность критериев (если
В любом случае, каким бы статистич. критерием не пользоваться в задаче различения гипотез H₀ и H₁,принятие гипотезы H₀(H₁) означает не то, что эта гипотеза H₀(H₁) в действительности истинна, а лишь факт отсутствия противоречий результатов наблюдений с принимаемой гипотезой на данном этапе исследований. Именно в силу этого согласия опыта и теории у экспериментатора нет оснований не верить в истинность H₀(H₁ )до тех нор, пока не появятся новые наблюдения, к-рые могут заставить изменить его отношение к принятой ранее гипотезе, а может даже и ко всей модели вообще.

Лит.:[1] Neyman J., Реаrsоn Б. S., лBlometrika