Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Выборочная дисперсия. Формула для вычисления дисперсии.




 

Для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения хnср, вводят сводную характеристику – выборочную дисперсию.

Выборочная дисперсия Dв – среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения х выб ср.

Если все значения x1, x2, xn признака выборки объема n различны, то Dв=(СУММА(i=1, n) (xi-xnср выб)^2)/n.

Если же все значения признака х1, х2, xn имеют соответственно частоты n1, n2 nk причем n1+n2+nk=n, то Dв=(СУММА(i=1, k) ni*(xi-xnсрвыб)^2)/n, т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.

КРОМЕ дисперсии для хар-тики рассеяния значений признака выб совокуп-ти вокруг своего сред знач-я пользуются сводной хар-тикой – СКО.

ФОРМУЛА для вычисления дисперсии

ТЕОРЕМА. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней: D=(x^2)ср – [xср]^2

ДОК-ВО. Dв=(СУММА(ni*(xi-xср)^2)/n = (СУММА(ni*(xi^2-2xi*xср+(x ср)^2))/n=(СУММАni*(xi^2))/n – 2*x|*(СУММАni*xi)/n+[x|]^2*(СУММА ni)/n=(x^2)| - 2*x|*x| + [x|]^2 = (x^2)ср – [xср]^2

Где x| = (СУММАni*xi)/n; (x^2)| = (СУММАni*xi^2)/n

 

Точность оценки, доверительная вероятность, доверительный интервал.

Точечной называют оценку, которая определяется одним числом. При выборке малого объема точечная оценка может значит-но отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальная – оценка, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Интервальная оценка – интервал, который покрывает оцениваемый параметр.

Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q-Q*|. Если б>0 и |Q-Q*|<б, то б называется точностью оценки, и оценка тем точнее, чем меньше б.

Надежность оценки Q по Q* (доверительная в-ть) – в-ть гамма, с которой осуществляется нер-во |Q-Q*|<б. Обычно надежность оценки задается наперед, причем в кач-ве гамма берут число, близкое к 1. Наболее часто задают надежность, равную 0,95; 0,99 и 0.999.

Пусть в-ть того, что |Q-Q*|<б, равна гамма. P[|Q-Q*|<б] = гамма.

Заменим нер-во |Q-Q*|<б равносильным ему нер-вом –б<Q-Q*<+б, или Q*–б<Q<Q*+б.

Имеем P[Q*–б<Q<Q*+б]=гамма. Это соотношение следует понимать так: в-ть того, что интервал (Q*–б; Q*+б) заключает в себе (покрывает) неизвестный параметр Q, равна гамма.

Доверительным называют интервал (Q*–б; Q*+б), который покрывает неизвестный параметр с заданной в-тью гамма.

 

Доверительный интервал для оценки математического ожидания нормального распределения при известном и неизвестном среднем квадратическом отклонении.

 

1. При известном СКО

xвыб| - t*СКО/SQRn<a<xвыб| + t*СКО/SQRn

t – аргумент ф-ии Лапласа, такой, что Ф(t)=гамма/2

2. При неизвестном СКО

xвыб| - tгамма*s/SQRn<a<xвыб| + tгамма* s/SQRn

tгамма – табулированный параметр, который находится в приложении tгамма (n; гамма).

 

Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции.

 

Зависимость м/д переменными Х и У называется функциональной, если существует ф-ия y=f(x) по которой каждому значению х принадлежащему Х ставится в соответствие единственное значение у.

Статистической называют зависимость м/д Х и У, при которой изменение одной из величин влечет изменение распределения другой.

Частным случаем стат зависимости явл-ся зависимость корреляционная, при которой изменение среднего значения другой.

Корреляционной зависимостью признака У от Х называют функциональную зависимость условного среднего ух| от х, т.е. ух|=f(x) – выборочное уравнение регрессии.

ух| - среднее арифметическое наблюдавшихся значений У, соответствующих Х=х.

Постановка задачи:

1. Существует ли связь м/д 2мя и более переменными

2. Какой тип она имеет

3. Насколько она сильна

4. Какой прогноз можно сделать, основываясь на этой связи

ЗАДАЧИ

1. Оценить тесноту (силу) корреляционной связи. Корреляция – стат метод, позволяющий определить, существует ли взаимосвязь м/д переменными и насколько она сильна.

2. Установить форму корреляционной связи, т.е. вид ф-ии регрессии (линейная, квадратическая, показательная…)

Регрессия – стат метод, который используется для описания характера связи м/д переменными.

 

 

Уравнение прямой линии регрессии.

 

Ур-ие ух|=f(x) выборочное уравнение регрессии У на Х. Ф-ия f(x) – выборочная регрессия У на Х, а её график – выборочная линия регрессии У на Х.

Аналогично ур-ие ху|=фи(у) – выборочное ур-ие регрессии Х на У. Ф-ия фи(у) – выборочная регрессия Х на У.

 

Свойства выборочного коэффициента корреляции.

 

Теснота линейной корреляционной связи м/д признаками Х и У оценивается по величине выборочного коэффициента корреляции признаков Х и У.

r(xy)=(СУММА(x-x|)*(y-y|)) / SQR (СУММА(x-x|)^2)*СУММА(y-y|)^2)

r(xy)=(n*СУММАx*y – СУММАx*СУММАy)/SQR(n*(СУММАx^2)-(СУММАx)^2) * SQR(n*(СУММАy^2)-(СУММАy)^2)

r(xy)=((xy)|-x|*y|)/СКОх*СКОу

СВОЙСТВА

1. Коэф заключается на отрезке [-1; 1]

2. Если r(xy)>0, то м/д признаками Х и У сущ-ет прямая связь, если r(xy)<0, то обратная.

3. Условие |r(xy)|=1 является необходимым и достаточным условием сущ-вания линейной функциональной зависимости

4. При r(xy)=0 лин кор связи м/д признаками не сущ-ет (при этом может быть нелинейная кор связь)

 

Статистическая гипотеза. Статистический критерий.

 

Статистической называют гипотезу о виде неизвестного распределение или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу Н0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной.

Простой называют гипотезу, содержащую, только 1 предположение. СЛОЖНОЙ – гипотезу. Которая сост из конечного или бесконечного числа простых гипотез.

Стат критерий – случайная величина К, которая служит для проверки нулевой гипотезы.

 

Ошибки первого и второго рода, уровень значимости.

 

В результате проверки гипотезы могут быть допущены ошибки двух родов.

Ошибка 1 рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность ошибки 1 рода называется уровнем значимости и обозначается α.

Ошибка 2 рода состоит в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки 2 рода обозначается β и называется риск два.

 

Критическая область и область принятия гипотезы. Критические точки.

 

Критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы – совокупность значений критерия, при которых нулевую гипотезу не отклоняют.

ТИПЫ критических областей.

Правосторонней называют критическую обл, определяемую нер-вом К>k кр, где k кр>0

ГРАФИК

 

Левосторонней называют критическую область, определяемую нер-вом К<k кр, где k кр<0

ГРАФИК

 

Двусторонней называют критическую обл, определяемую нер-вом К<k1, К>k2, где k1<k2

ГРАФИК

 










Последнее изменение этой страницы: 2018-05-29; просмотров: 291.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...