Поскольку статистика как метод исследования имеет дело с данным, в которых интересующиеисследователязакономерностиискажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных.
Педагогическая гипотеза (научное предположен ие о преимуществе того или иного метода) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез.
Возможны два типа гипотез: первый тип - описательные гипотезы, в которых описываются причины и возможные следствия. Второй тип - объяснительные : в них дается объяснение возможным следствиям из определенных причин, а также характеризуются условия, при которых эти следствия обязательно последуют, т. е. объясняется, в силу каких факторов и условий будет данное следствие. Описательные гипотезы не обладают предвидением, а объяснительные обладают таким свойством. Объяснительные гипотезы выводят исследователей на предположения о существовании определенных закономерных связеймежду явлениями, факторами и условиями.
Гипотезы в педагогических исследованиях могут предполагать, что одно из средств (или группа их) будет более эффективным, чем другие средства. Здесьгипотетическивысказываетсяпредположение о сравнительной эффективности средств, способов, методов, форм обучения.
Более высокий уровень гипотетического предсказания состоит в том, что автор исследования высказывает гипотезу о том, что какая-то система мер будет не только лучше другой, ноиизрядавозможных систем она кажется оптимальной с точки зрения определенных критериев. Такая гипотеза нуждаетсявещеболеестрогомиоттого более развернутом доказательстве.
Кулаичев А.П. Методы и средства анализа данных в среде Windows. Изд. 3-е, перераб. и доп. - М: ИнКо, 1999, стр. 129-131
Психолого-педагогический словарь для учителей и руководителей общеобразовательных учреждений. – Ростов-н/ Д: Феникс, 1998, стр. 92
5. Основные проблемы прикладной статистики - описание данных, оценивание и проверка гипотез
Основные понятия, используемые при проверке гипотез
Статистическая гипотеза – любое предположение, касающееся неизвестного распределения случайных величин (элементов). Приведем формулировки нескольких статистических гипотез:
1. Результаты наблюдений имеют нормальное распределение с
нулевым математическим ожиданием.
2. Результаты наблюдений имеют функцию распределения N
(0,1).
3. Результаты наблюдений имеют нормальное распределение.
4. Результаты наблюдений в двух независимых выборках имеют
одно и то же нормальное распределение.
5.
Результаты наблюдений в двух независимых выборках имеют одно и то же
распределение.
Различают нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают Н 0 , альтернативную – Н 1 (от Hypothesis – «гипотеза» (англ.)).
Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Рассмотрим примеры.
Пример 11. Пусть нулевая гипотеза – гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 1. Сказанное означает, то реальная ситуация описывается вероятностной моделью, согласно которой результаты наблюдений рассматриваются как реализации независимых одинаково распределенных случайных величин с функцией распределения N (0,σ), где параметр σ неизвестен статистику. В рамках этой модели нулевую гипотезу записывают так:
Н 0: σ = 1,
а альтернативную так:
Н 1: σ ≠ 1.
Пример 12. Пусть нулевая гипотеза – по-прежнему гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 3 из того же списка. Тогда в вероятностной модели управленческой, экономической или производственной ситуации предполагается, что результаты наблюдений образуют выборку из нормального распределения N (m , σ) при некоторых значениях m и σ. Гипотезы записываются так:
Н 0: m = 0, σ = 1
(оба параметра принимают фиксированные значения);
Н 1: m ≠ 0 и/или σ ≠ 1
(т.е. либо m ≠ 0, либо σ ≠ 1, либо и m ≠ 0, и σ ≠ 1).
Пример 13. Пусть Н 0 – гипотеза 1 из приведенного выше списка, а Н 1 – гипотеза 3 из того же списка. Тогда вероятностная модель – та же, что в примере 12,
Н 0: m = 0, σ произвольно;
Н 1: m ≠ 0, σ произвольно.
Пример 14. Пусть Н 0 – гипотеза 2 из приведенного выше списка, а согласно Н 1 результаты наблюдений имеют функцию распределения F (x ), не совпадающую с функцией стандартного нормального распределения Ф(х). Тогда
Н 0: F (х) = Ф(х) при всех х (записывается как F (х) ≡ Ф(х) );
Н 1: F (х 0) ≠ Ф(х 0) при некотором х 0 (т.е. неверно, что F (х) ≡ Ф(х) ).
Примечание. Здесь ≡ - знак тождественного совпадения функций (т.е. совпадения при всех возможных значениях аргумента х ).
Пример 15. Пусть Н 0 – гипотеза 3 из приведенного выше списка, а согласно Н 1 результаты наблюдений имеют функцию распределения F (x ), не являющуюся нормальной. Тогда
При некоторых m , σ;
Н
1: для любых m
, σ найдется х 0
= х 0
(m
, σ) такое, что .
Пример 16. Пусть Н 0 – гипотеза 4 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F (x ) и G (x ), являющихся нормальными с параметрами m 1 , σ 1 и m 2 , σ 2 соответственно, а Н 1 – отрицание Н 0 . Тогда
Н 0: m 1 = m 2 , σ 1 = σ 2 , причем m 1 и σ 1 произвольны;
Н 1: m 1 ≠ m 2 и/или σ 1 ≠ σ 2 .
Пример 17. Пусть в условиях примера 16 дополнительно известно, что σ 1 = σ 2 . Тогда
Н 0: m 1 = m 2 , σ > 0, причем m 1 и σ произвольны;
Н 1: m 1 ≠ m 2 , σ > 0.
Пример 18. Пусть Н 0 – гипотеза 5 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F (x ) и G (x ) соответственно, а Н 1 – отрицание Н 0 . Тогда
Н 0: F (x ) ≡ G (x ) , где F (x )
Н 1: F (x ) и G (x ) - произвольные функции распределения, причем
F (x ) ≠ G (x ) при некоторых х .
Пример 19. Пусть в условиях примера 17 дополнительно предполагается, что функции распределения F (x ) и G (x ) отличаются только сдвигом, т.е. G (x ) = F (x - а) при некотором а . Тогда
Н 0: F (x ) ≡ G (x ) ,
где F (x ) – произвольная функция распределения;
Н 1: G (x ) = F (x - а), а ≠ 0,
где F (x ) – произвольная функция распределения.
Пример 20. Пусть в условиях примера 14 дополнительно известно, что согласно вероятностной модели ситуации F (x ) - функция нормального распределения с единичной дисперсией, т.е. имеет вид N (m , 1). Тогда
Н 0: m = 0 (т.е. F (х) = Ф(х)
при всех х );(записывается как F (х) ≡ Ф(х) );
Н 1: m ≠ 0
(т.е. неверно, что F (х) ≡ Ф(х) ).
Пример 21. При статистическом регулировании технологических, экономических, управленческих или иных процессов рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы
Н 0: m = m 0 ,
Н 1: m = m 1 ,
где значение параметра m = m 0 соответствует налаженному ходу процесса, а переход к m = m 1 свидетельствует о разладке.
Пример 22. При статистическом приемочном контроле число дефектных единиц продукции в выборке подчиняется гипергеометрическому распределению, неизвестным параметром является p = D / N – уровень дефектности, где N – объем партии продукции, D – общее число дефектных единиц продукции в партии. Используемые в нормативно-технической и коммерческой документации (стандартах, договорах на поставку и др.) планы контроля часто нацелены на проверку гипотезы
Н 0: p < AQL
Н 1: p > LQ ,
где AQL – приемочный уровень дефектности, LQ – браковочный уровень дефектности (очевидно, что AQL < LQ ).
Пример 23. В качестве показателей стабильности технологического, экономического, управленческого или иного процесса используют ряд характеристик распределений контролируемых показателей, в частности, коэффициент вариации v = σ/M (X ). Требуется проверить нулевую гипотезу
Н 0: v < v 0
при альтернативной гипотезе
Н 1: v > v 0 ,
где v 0 – некоторое заранее заданное граничное значение.
Пример 24. Пусть вероятностная модель двух выборок – та же, что в примере 18, математические ожидания результатов наблюдений в первой и второй выборках обозначим М (Х ) и М (У ) соответственно. В ряде ситуаций проверяют нулевую гипотезу
Н 0: М(Х) = М(У)
против альтернативной гипотезы
Н 1: М(Х) ≠ М(У).
Пример 25 . Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно 0, При проверке симметричности
Н 0: F (- x ) = 1 – F (x ) при всех x , в остальном F произвольна;
Н 1: F (- x 0 ) ≠ 1 – F (x 0 ) при некотором x 0 , в остальном F произвольна.
В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже.
Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та же, а альтернативные – различны. Поэтому в условиях примера 14 следует применять методы, основанные на критериях согласия с параметрическим семейством (типа Колмогорова или типа омега-квадрат), а в условиях примера 20 – методы на основе критерия Стьюдента или критерия Крамера-Уэлча . Если в условиях примера 14 использовать критерий Стьюдента, то он не будет решать поставленных задач. Если в условиях примера 20 использовать критерий согласия типа Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента.
При обработке реальных данных большое значение имеет правильный выбор гипотез Н 0 и Н 1 . Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального .
Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных Н 1 . В частности при проверке гипотезы 2 (из приведенного выше списка) как нулевой следует в качестве альтернативной гипотезы использовать Н 1 из примера 14, а не из примера 20, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе.
Предыдущая |
На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположений (гипотез) относительно природы и величины неизвестных параметров анализируемой генеральной совокупности (совокупностей). Например, исследователь высказывает предположение: "выборка извлечена из нормальной генеральной совокупности" или "генеральная средняя анализируемой совокупности равна пяти". Такие предположения называются статистическими гипотезами.
Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется проверкой статистических гипотез .
Выдвинутая гипотеза называется нулевой (основной) . Ее принято обозначать Н 0 .
По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую) , противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н 1 .
Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н 0 .
Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой , например: "среднедушевой совокупный доход населения России составляет 650 рублей в месяц"; "уровень безработицы (доля безработных в численности экономически активного населения) в России равна 9%" . В других случаях гипотеза называется сложной .
В качестве нулевой гипотезы Н 0 принято выдвигать простую гипотезу, т.к. обычно бывает удобнее проверять более строгое утверждение.
Гипотезы о виде закона распределения исследуемой случайной величины;
Гипотезы о числовых значениях параметров исследуемой генеральной совокупности;
Гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;
Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками и др.
Так как проверка статистических гипотез осуществляется на основании выборочных данных, т.е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н 0 имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.
Так, в какой-то небольшой доле случаев α нулевая гипотеза Н 0 может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой первого рода . А ее вероятность принято называтьуровнем значимости и обозначать α .
Наоборот, в какой-то небольшой доле случаев β нулевая гипотеза Н 0 принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н 1 . Такую ошибку называют ошибкой второго рода . Вероятность ошибки второго рода принято обозначать β . Вероятность 1 - β называют мощностью критерия .
При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок α или β . Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки первого рода α - уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью α отклонить правильную в действительности гипотезу Н 0 , следует принять тот, который сопровождается меньшей ошибкой второго рода β , т.е. большей мощностью. Снижения вероятностей обеих ошибок α и β можно добиться путем увеличения объема выборки.
Правильное решение относительно нулевой гипотезы Н 0 также может быть двух видов:
Будет принята нулевая гипотеза Н 0 , тогда как и на самом деле в генеральной совокупности верна нулевая гипотеза Н 0 ; вероятность такого решения 1 - α;
Нулевая гипотеза Н 0 будет отклонена в пользу альтернативной Н 1, тогда как и на самом деле в генеральной совокупности нулевая гипотеза Н 0 отклоняется в пользу альтернативной Н 1 ; вероятность такого решения 1 - β - мощность критерия.
Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью таблицы 8.1.
Таблица 8.1
Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К ), являющего функцией от результатов наблюдения.
Статистический критерий - это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н 0 .
Статистический критерий, как и всякая функция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н 0 подчинена некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения f(k) .
Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия , который позволяет построить критерий наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н 0 , чтобы при заданном уровнем значимости α можно было бы найти критическую точку К кр .распределения f(k) , которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н 0 .
Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выборочным данным наблюдаемое значение критерия К набл. и определить является ли оно наиболее или менее правдоподобным в отношении нулевой гипотезы Н 0 .
Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона χ 2 ; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей - с помощью критерия F - Фишера; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z - нормальной распределенной случайной величины и критерия T - Стьюдента и т.д.
Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия (К набл. ).
Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н 0 ) и критическую область (область значений, менее правдоподобных в отношении таблицам распределения случайной величины К , выбранной в качестве критерия, называются критическими точками(К кр.).
Областью допустимых значений (областью принятия нулевой гипотезы Н 0) К Н 0 не отклоняется.
Критической областью называют совокупность значений критерия К , при которых нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 .
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области .
Если конкурирующая гипотеза - правосторонняя, например, Н 1: а > а 0 , то и критическая область - правосторонняя (рис 1). При правосторонней конкурирующей гипотезе критическая точка (К кр. правосторонняя) принимает положительные значения.
Если конкурирующая гипотеза - левосторонняя, например, Н 1: а < а 0 , то и критическая область - левосторонняя (рис 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (К кр. левосторонняя) .
Если конкурирующая гипотеза - двусторонняя, например, Н 1: а ¹ а 0 , то и критическая область - двусторонняя (рис 3). При двусторонней конкурирующей гипотезе определяются две критические точки (К кр. левосторонняя и К кр. правосторонняя) .
Область допустимых Критическая
значений область
Формулирование гипотез систематизирует предположения исследователя и представляет их в четком, лаконичном виде. Решение, которое требуется принять исследователю, касается истинности или ложности статистической гипотезы. Различают два вида гипотез: научные и статистические. Научная гипотеза – это предполагаемое решение проблемы (формулируется как теорема). Статистическая гипотеза – просто утверждение относительно неизвестного параметра генеральной совокупности (свойстве случайной величины или событии), которое формулируется для проверки надежности связи и которое можно проверить по известным выборочным статистикам (результатам исследования, имеющимся эмпирическим данным) .
Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные. Нулевая гипотеза (Н 0) это гипотеза об отсутствии различий, отсутствие влияния фактора, отсутствие эффекта и т.п . Это то, что предполагается опровергнуть, если перед нами стоит задача доказать значимость различий. Альтернативная гипотеза (Н 1) это гипотеза о значимости различий. Это то, что предполагается доказать, поэтому ее иногда называют экспериментальной или рабочей гипотезой.
Сама же процедура обработки полученных количественных данных, заключающаяся в вычислении некоторых статистических характеристик и оценок, позволяющих проверить нулевую гипотезу называется статистическим анализом .
Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными. Гипотеза называется направленной , если она содержит указание на направление отличий. Такие гипотезы следует формулировать, например, в том случае, если в одной из групп индивидуальные значения испытуемых по какому-либо признаку выше, а в другой ниже, или необходимо доказать, что в одной из групп под влиянием каких-либо экспериментальных воздействий произошли более выраженные изменения, чем в другой группе. Гипотеза называется ненаправленной , если ее формулировка предполагает лишь определение отличий или не отличий (без указания направления отличий). Например, если необходимо доказать, в двух разных группах различаются формы распределения признака.
Примеры формулирования гипотез.
Метод, который используется для принятия решения относительно справедливости статистической гипотезы, называется проверкой гипотезы . Основной принцип проверки гипотезы состоит в том, что выдвигается нулевая гипотеза Н 0 , с тем, чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу Н 1 .
При проверке любой статистической гипотезы решение исследователя никогда не принимается с уверенностью, поскольку всегда остается риск принятия неправильного решения.
Обычно используемые выборки невелики, и в этих случаях вероятность ошибки может быть значительной. Существует так называемый уровень достоверности (уровень значимости) различия. Это вероятность того, что различия считаются существенными, а они на самом деле случайны. То есть это вероятность отклонения нулевой гипотезы, в то время как она верна.
Когда указывается, что различия достоверны на 5%-ном уровне значимости, или при p£0,05, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,05 (низший уровень статистической значимости). Если указывается, что различия достоверны на 1%-ном уровне значимости, или при p£0,01, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01 (достаточный уровень статистической значимости). Если указывается, что различия достоверны на 0,1%-ном уровне значимости, или при p£0,001, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,001 (высший уровень статистической значимости).
Правило отклонения Н 0 и принятия Н 1:
Если эмпирическое значение критерия равняется критическому значению, соответствующему p£0,05 или превышает его, то Н 0 отклоняется, но еще нельзя определенно принять Н 1 .
Если эмпирическое значение критерия равняется критическому значению, соответствующему p£0,01 или превышает его, то Н 0 отклоняется принимается Н 1 .
Для наглядности правила принятия решения можно использовать так называемую «ось значимости».
Если уровень достоверности не превышен, то можно считать вероятным, что выявленная разница действительно отражает положение дел в популяции. Для каждого статистического метода этот уровень можно узнать из таблиц распределения критических значений соответствующих критериев.
T – критерий Стьюдента
Это параметрический метод, используемый для проверки гипотез о достоверности разницы средних при анализе количественных данных в популяциях с нормальным распределением и с одинаковой дисперсией. Он хорошо применим в случае сравнения величин средних случайных значений измеряемого признака в контрольной и экспериментальной группах, в различных половозрастных группах, группах, имеющих другие различные признаки.
Обязательным условием применимости параметрических методов, в том числе и t‑критерия Стьюдента, для доказательства статистических гипотез является подчинение эмпирического распределения исследуемого признака закону нормального распределения .
Метод Стьюдента различен для независимых и зависимых выборок.
Независимые выборки получаются при исследовании двух различных групп испытуемых (например, контрольной и опытной групп). К зависимым выборкам относятся, например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной.
Проверяемая гипотеза Н 0 состоит в том, что разность между средними значениями двух выборок равна нулю ( = 0), другими словами это гипотеза о равенстве средних (). Альтернативная гипотеза Н 1 состоит в том, что эта разность отлична от нуля ( ¹ 0) или же существует отличие выборочных средних ().
В случае независимых выборок
для анализа разницы средних применяют формулу: при n 1 , n 2 > 30
и формулу при n 1 , n 2 < 30, где
Среднее арифметическое значение первой выборки;
Среднее арифметической значение второй выборки;
s 1 – стандартное отклонение для первой выборки;
s 2 – стандартное отклонение для второй выборки;
n 1 и n 2 – число элементов в первой и второй выборках.
Для нахождения критического значения t определим число степеней свободы:
n = n 1 - 1 + n 2 - 1 = (n 1 + n 2) – 2 = n - 2.
Если |t эмп | > t кр, то нулевую гипотезу отбрасываем и принимаем альтернативную, то есть считаем разницу средних достоверной. Если |t эмп | < t кр, то разница средних недостоверна.
В случае зависимых выборок
для определения достоверности разницы средних применяется следующая формула: , где
d – разность между результатами в каждой паре (х i – y i);
åd – сумма этих частных разностей;
åd 2 – сумма квадратов частных разностей;
n – число пар данных.
Число степеней свободы в случае зависимых выборок для определения t критерия будет равно n = n - 1.
Существуют и другие статистические критерии проверки гипотез, как параметрические, так и непараметрические. Например, математико-статистический критерий, позволяющий судить о сходстве и различиях в дисперсиях случайных величин, называется критерием Фишера.
В самом общем виде под значением «корреляция» понимается взаимная связь. Хотя, говоря о корреляции, используют также термины «корреляционная связь» и «корреляционная зависимость», которые часто используются как синонимы.
Под корреляционной связью понимают согласованные изменения двух или большего количества признаков, т.е. изменчивость одного признака находится в некотором соответствии с изменчивостью другого.
Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Таким образом, согласованные изменения признаков и отражающая это корреляционная связь между ними может свидетельствовать не о зависимости этих признаков между собой, а о зависимости обоих этих признаков от какого-то третьего признака или сочетания признаков, не рассматриваемых в исследовании.
На основе собранных в статистических исследованиях данных после их обработки делаются выводы об изучаемых явлениях. Эти выводы делаются путём выдвижения и проверки статистических гипотез.
Статистической гипотезой называется любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Статистические гипотезы проверяются статистическими методами.
Проверяемая гипотеза называется основной (нулевой) и обозначается Н 0 . Кроме нулевой выдвигается ещё и альтернативная (конкурирующая) гипотеза Н 1 ,отрицающая основную. Таким образом, в результате проверки будет принята одна и только одна из гипотез, а вторая будет отвергнута.
Типы ошибок
. Выдвинутая гипотеза проверяется на основании исследования выборки, полученной из генеральной совокупности. Из-за случайности выборки в результате проверки не всегда делается правильный вывод. При этом могут возникать следующие ситуации:
1. Основная гипотеза верна и она принимается.
2. Основная гипотеза верна, но она отвергается.
3. Основная гипотеза не верна и она отвергается.
4. Основная гипотеза не верна, но она принимается.
Во случае 2 говорят об ошибке первого рода
, в последнем случае речь идёт об ошибке второго рода
.
Таким образом, по одним выборкам принимается правильное решение, а по другим – неправильное. Решение принимается по значению некоторой функции выборки, называемой статистической характеристикой
, статистическим критерием
или просто статистикой
. Множество значений этой статистики можно разделить на два непересекающихся подмножества:
- Н 0 принимается (не отклоняется), называется областью принятия гипотезы (допустимой областью) ;
- подмножество значений статистики, при которых гипотеза Н 0 отвергается (отклоняется) и принимается гипотеза Н 1 ,называется критической областью.
Выводы:
- Критерием называется случайная величина K , которая позволяет принять или отклонить нулевую гипотезу H0 .
- При проверке гипотез можно допустить ошибки 2 родов.
Ошибка первого рода состоит в том, что будет отклонена гипотеза H 0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости . Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.
Ошибка второго рода заключается в том, что гипотеза H0 принимается, если она неверна ("ложное срабатывание"). Вероятность ошибки этого рода обозначается β.
Классификация гипотез
Основная гипотеза Н 0 о значении неизвестного параметра q распределения обычно выглядит так:Н 0: q = q 0 .
Конкурирующая гипотеза Н 1 может при этом иметь следующий вид:
Н 1: q < q 0 , Н 1: q > q 0 или Н 1: q ≠ q 0 .
Соответственно получается левосторонняя, правосторонняя или двусторонняя критические области. Граничные точки критических областей (критические точки ) определяют по таблицам распределения соответствующей статистики.
При проверке гипотезы разумно уменьшить вероятность принятия неправильных решений. Допустимая вероятность ошибки первого рода
обозначается обычно a
и называется уровнем значимости
. Его значение, как правило, мало (0,1, 0,05, 0,01, 0,001
…). Но уменьшение вероятности ошибки первого рода приводит к увеличению вероятности ошибки второго рода (b
), т.е. стремление принимать только верные гипотезы вызывает возрастание числа отброшенных правильных гипотез. Поэтому выбор уровня значимости определяется важностью поставленной проблемы и тяжестью последствий неверно принятого решения.
Проверка статистической гипотезы состоит из следующих этапов
:
1) определение гипотез Н
0 и Н
1 ;
2) выбор статистики и задание уровня значимости;
3) определение критических точек К кр
и критической области;
4) вычисление по выборке значения статистики К экс
;
5) сравнение значения статистики с критической областью (К кр
и К экс
);
6) принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н
0 и отвергается гипотеза H
1 , а если входит в критическую область, то отвергается гипотеза Н
0 и принимается гипотеза Н
1 . При этом, результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н
1 ,
то можно считать её доказанной, а если принялигипотезу Н
0 ,
то признали, что она не противоречит результатам наблюдений.Однако этим свойством наряду с Н
0 могут обладать и другие гипотезы.
Классификация проверок гипотез
Рассмотрим далее несколько различных статистических гипотез и механизмов их проверки.I) Гипотеза о генеральном среднем значении нормального распределения при не известной дисперсии . Предполагаем, что генеральная совокупность имеет нормальное распределение, её среднее и дисперсия неизвестны, но есть основания полагать, что генеральное среднее равно a . При уровне значимости α нужно проверить гипотезу Н 0: x =a. В качестве альтернативной можно использовать одну из трёх рассмотренных выше гипотез. В данном случае статистикой служит случайная величина , имеющая распределение Стьюдента с n – 1 степенями свободы. Определяется соответствующее экспериментальное (наблюдаемое) значение t экс t кр Н 1: x >a оно находится по уровню значимости α и числу степеней свободы n – 1. Если t экс < t кр Н 1: x ≠a критическое значение находится по уровню значимости α / 2 и том же числе степеней свободы. Нулевая гипотеза принимается, если | t экс |
![](https://i1.wp.com/math.semestr.ru/group/images/hypothesis-1-image007.gif)
имеющую нормальное распределение, причём M (Z ) = 0, D (Z ) = 1. Определяется соответствующее экспериментальное значение z экс . Из таблицы функции Лапласа находится критическое значение z кр . При альтернативной гипотезе Н 1: x >y оно находится из условия F (z кр ) = 0,5 – a . Если z экс < z кр , то нулевая гипотеза принимается, в противоположном случае – отвергается. При альтернативной гипотезе Н 1: x ≠y критическое значение находится из условия F (z кр ) = 0,5×(1 – a ). Нулевая гипотеза принимается, если |z экс | < z кр .
III) Гипотеза о равенстве двух средних значений нормально распределённых генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
. При уровне значимости α нужно проверить основную гипотезу Н
0: x
=y
. В качестве статистики используем случайную величину
,
имеющую распределение Стьюдента с (n х
+ n у
– 2) степенями свободы. Определяется соответствующее экспериментальное значение t экс
. Из таблицы критических точек распределения Стьюдента находится критическое значение t кр
. Всё решается аналогично гипотезе (I).
IV) Гипотеза о равенстве двух дисперсий нормально распределённых генеральных совокупностей . В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х ) = D (Y ). Статистикой служит случайная величина , имеющая распределение Фишера – Снедекора с f 1 = n б – 1 и f 2 = n м – 1 степенями свободы (S 2 б – большая дисперсия, объём её выборки n б ). Определяется соответствующее экспериментальное (наблюдаемое) значение F экс . Критическое значение F кр при альтернативной гипотезе Н 1: D (Х ) > D (Y ) находится из таблицы критических точек распределения Фишера – Снедекора по уровню значимости a и числу степеней свободы f 1 и f 2 . Нулевая гипотеза принимается, если F экс < F кр .
Инструкция . Для расчета необходимо указать размерность исходных данных.
V) Гипотеза о равенстве нескольких дисперсий нормально распределённых генеральных совокупностей по выборкам одинакового объёма.
В данном случае при уровне значимостиa
нужно проверить гипотезу Н
0: D
(Х
1) = D
(Х
2) = …= D
(Х l
). Статистикой служит случайная величина , имеющая распределение Кочрена со степенями свободыf
= n
– 1 и l
(n –
объём каждой выборки, l
– количество выборок). Проверка этой гипотезы проводится так же, как и предыдущей. Используется таблица критических точек распределения Кочрена.
VI) Гипотеза о существенности корреляционной связи.
В данном случае при уровне значимостиa
нужно проверить гипотезу Н
0: r
= 0. (Если коэффициент корреляции равен нулю, то соответствующие величины не связаны друг с другом). Статистикой в данном случае служит случайная величина
,
имеющая распределение Стьюдента с f
= n
– 2 числом степеней свободы. Проверка этой гипотезы проводится аналогично проверке гипотезы (I).
Инструкция . Укажите количество исходных данных.
VII) Гипотеза о значении вероятности появления события.
Проведено достаточно большое количество n
независимых испытаний, в которых событие А
произошло m
раз. Есть основания полагать, что вероятность наступления данного события в одном испытании равна р 0
. Требуется при уровне значимостиa
проверить гипотезу о том, что вероятность события А
равна гипотетической вероятности р 0
. (Т.к. вероятность оценивается по относительной частоте, то проверяемую гипотезу можно сформулировать и иначе: значимо или нет различаются наблюдаемая относительная частота и гипотетическая вероятность).
Количество испытаний достаточно велико, поэтому относительная частота события А
распределена по нормальному закону. Если нулевая гипотеза верна, то её математическое ожидание равно р 0
, а дисперсия . В соответствии с этим в качестве статистики выберем случайную величину
,
которая распределена приближённо по нормальному закону с нулевым математическим ожиданием и единичной дисперсией. Проверка данной гипотезы осуществляется точно так же, как и в случае (I).
Инструкция . Для расчета необходимо заполнить исходные данные.