Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Проверка статистических гипотез




Под статистической гипотезой понимают всякое высказывание, которое можно проверить по выборке. Как правило, статистические гипотезы делят на гипотезы о законах распределения и гипотезы о параметрах закона распределения. Наиболее часто встречаются гипотезы, связанные со сравнением выборок.

Статистической гипотезой называется всякое непротиворечивое множество утверждений относительно свойств распределения случайной величины. Любое из утверждений  называется альтернативой гипотезы. Простейшей гипотезой является двухальтернативная:  В этом случае альтернативу  называют нулевой гипотезой, а - конкурирующей гипотезой. Нулевая гипотеза, как правило, утверждает, что отличия статистически незначимы и вызваны статистической изменчивостью.

Критерием называется случайная величина ,где  – значения выборки, которая позволяет принять или отклонить нулевую гипотезу H0. Значения критерия, при которых гипотеза  отвергается, образуют критическую область проверяемой гипотезы, а значения критерия, при которых гипотезу принимают, образуют область принятия гипотезы (область допустимых значений). Критические точки отделяют критическую область от области принятия гипотезы.

Ошибка первого рода состоит в том, что будет отклонена гипотеза , если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости. Наиболее часто на практике принимают, что α = 0,05 или α = 0,01. Обычно задают вероятность совершить ошибку первого рода – максимальную вероятность этого события, при которой событие считается практически невозможным. Уровень этой вероятности зависит от предметной области – оборона, медицина, техника и определяется последствиям ошибки – чем тяжелей последствия, тем меньше вероятность. 

Ошибка второго рода состоит в том, что принимается неверная гипотеза. Вероятность ошибки второго рода обозначается через β . Величина (1– β) называется мощностью данного критерия.

α = P{(x1, x2, …, xn) Î S1/H0 }, β = P{(x1, x2, …, xn) Î S0/H1 }.

Одновременно снизить ошибку первого и второго рода нельзя, поэтому задача решается разумным компромиссом на основе опыта. В математической статистике принята следующая схема: вероятность ошибки первого рода обычно заранее фиксируют и стараются найти критерий, который при фиксированном α обладает большей мощностью (т.е. ошибка 1-го рода фиксирована, а величина ошибки 2-го рода– наименьшая).

Обычно уровень значимости α = 0.05; 0.01 или 0.005 (или меньше), причем его величина зависит от важности задачи: в медицине 0.005, в экономике и технике 0,05.

Проверка гипотезы о равенстве вероятностей. Пусть произведено две серии опытов, состоящих соответственно из  и  опытов. В каждом из них регистрировалось появление одного и того же события А . В первой серии событие А появилось в  опытах, во второй — в опытах, причем частота события А в первой серии получилась больше, чем во второй: . Разность между двумя частота получилась равной  .

Спрашивается, значимо или не значимо это расхождение? Указывает ли оно на то, что в первой серии опытов событие A действительно вероятнее, чем во второй, или расхождение между частотами надо считать случайным? Выдвинем двухальтернативную гипотезу  , где:  - различия в вероятностях не существует, т.е. обе серии опытов произведены в одинаковых условиях, а расхождение  объясняется случайными причинами,  - различие в вероятностях существует, т.е. обе серии опытов произведены не в одинаковых условиях.

В данном случае нуль-гипотеза  состоит в том, что обе серии опытов однородны и что вероятность  появления события А в них одна и та же, приближенно равная частоте, которая получится, если обе серии смешать в одну :  .

При достаточно больших и  каждая из случайных величин и распределена практически нормально, с одним и тем же математическим ожиданием . Что касается дисперсий  и  в первой и во второй сериях, то они различны и равны соответственно.

 ,

В качестве критерия будем использовать случайную величину , которая также имеет приближенно нормальное распределение с математическим ожиданием и дисперсией , откуда

Определим критическую точку  для заданного уровня значимости α из уравнения:

 т.е.

Если значение, вычисленное по формуле  , больше, чем критическое значение, т.е.  , то гипотеза  отклоняется, в противном случае нет оснований ее отклонить.










Последнее изменение этой страницы: 2018-05-10; просмотров: 132.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...