Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Выборочная дисперсия. Формула для вычисления дисперсии.
Для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения хnср, вводят сводную характеристику – выборочную дисперсию. Выборочная дисперсия Dв – среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения х выб ср. Если все значения x1, x2, xn признака выборки объема n различны, то Dв=(СУММА(i=1, n) (xi-xnср выб)^2)/n. Если же все значения признака х1, х2, xn имеют соответственно частоты n1, n2 nk причем n1+n2+nk=n, то Dв=(СУММА(i=1, k) ni*(xi-xnсрвыб)^2)/n, т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам. КРОМЕ дисперсии для хар-тики рассеяния значений признака выб совокуп-ти вокруг своего сред знач-я пользуются сводной хар-тикой – СКО. ФОРМУЛА для вычисления дисперсии ТЕОРЕМА. Дисперсия равна среднему квадратов значений признака минус квадрат общей средней: D=(x^2)ср – [xср]^2 ДОК-ВО. Dв=(СУММА(ni*(xi-xср)^2)/n = (СУММА(ni*(xi^2-2xi*xср+(x ср)^2))/n=(СУММАni*(xi^2))/n – 2*x|*(СУММАni*xi)/n+[x|]^2*(СУММА ni)/n=(x^2)| - 2*x|*x| + [x|]^2 = (x^2)ср – [xср]^2 Где x| = (СУММАni*xi)/n; (x^2)| = (СУММАni*xi^2)/n
Точность оценки, доверительная вероятность, доверительный интервал. Точечной называют оценку, которая определяется одним числом. При выборке малого объема точечная оценка может значит-но отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками. Интервальная – оценка, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок. Интервальная оценка – интервал, который покрывает оцениваемый параметр. Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q-Q*|. Если б>0 и |Q-Q*|<б, то б называется точностью оценки, и оценка тем точнее, чем меньше б. Надежность оценки Q по Q* (доверительная в-ть) – в-ть гамма, с которой осуществляется нер-во |Q-Q*|<б. Обычно надежность оценки задается наперед, причем в кач-ве гамма берут число, близкое к 1. Наболее часто задают надежность, равную 0,95; 0,99 и 0.999. Пусть в-ть того, что |Q-Q*|<б, равна гамма. P[|Q-Q*|<б] = гамма. Заменим нер-во |Q-Q*|<б равносильным ему нер-вом –б<Q-Q*<+б, или Q*–б<Q<Q*+б. Имеем P[Q*–б<Q<Q*+б]=гамма. Это соотношение следует понимать так: в-ть того, что интервал (Q*–б; Q*+б) заключает в себе (покрывает) неизвестный параметр Q, равна гамма. Доверительным называют интервал (Q*–б; Q*+б), который покрывает неизвестный параметр с заданной в-тью гамма.
Доверительный интервал для оценки математического ожидания нормального распределения при известном и неизвестном среднем квадратическом отклонении.
1. При известном СКО xвыб| - t*СКО/SQRn<a<xвыб| + t*СКО/SQRn t – аргумент ф-ии Лапласа, такой, что Ф(t)=гамма/2 2. При неизвестном СКО xвыб| - tгамма*s/SQRn<a<xвыб| + tгамма* s/SQRn tгамма – табулированный параметр, который находится в приложении tгамма (n; гамма).
Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции.
Зависимость м/д переменными Х и У называется функциональной, если существует ф-ия y=f(x) по которой каждому значению х принадлежащему Х ставится в соответствие единственное значение у. Статистической называют зависимость м/д Х и У, при которой изменение одной из величин влечет изменение распределения другой. Частным случаем стат зависимости явл-ся зависимость корреляционная, при которой изменение среднего значения другой. Корреляционной зависимостью признака У от Х называют функциональную зависимость условного среднего ух| от х, т.е. ух|=f(x) – выборочное уравнение регрессии. ух| - среднее арифметическое наблюдавшихся значений У, соответствующих Х=х. Постановка задачи: 1. Существует ли связь м/д 2мя и более переменными 2. Какой тип она имеет 3. Насколько она сильна 4. Какой прогноз можно сделать, основываясь на этой связи ЗАДАЧИ 1. Оценить тесноту (силу) корреляционной связи. Корреляция – стат метод, позволяющий определить, существует ли взаимосвязь м/д переменными и насколько она сильна. 2. Установить форму корреляционной связи, т.е. вид ф-ии регрессии (линейная, квадратическая, показательная…) Регрессия – стат метод, который используется для описания характера связи м/д переменными.
Уравнение прямой линии регрессии.
Ур-ие ух|=f(x) выборочное уравнение регрессии У на Х. Ф-ия f(x) – выборочная регрессия У на Х, а её график – выборочная линия регрессии У на Х. Аналогично ур-ие ху|=фи(у) – выборочное ур-ие регрессии Х на У. Ф-ия фи(у) – выборочная регрессия Х на У.
Свойства выборочного коэффициента корреляции.
Теснота линейной корреляционной связи м/д признаками Х и У оценивается по величине выборочного коэффициента корреляции признаков Х и У. r(xy)=(СУММА(x-x|)*(y-y|)) / SQR (СУММА(x-x|)^2)*СУММА(y-y|)^2) r(xy)=(n*СУММАx*y – СУММАx*СУММАy)/SQR(n*(СУММАx^2)-(СУММАx)^2) * SQR(n*(СУММАy^2)-(СУММАy)^2) r(xy)=((xy)|-x|*y|)/СКОх*СКОу СВОЙСТВА 1. Коэф заключается на отрезке [-1; 1] 2. Если r(xy)>0, то м/д признаками Х и У сущ-ет прямая связь, если r(xy)<0, то обратная. 3. Условие |r(xy)|=1 является необходимым и достаточным условием сущ-вания линейной функциональной зависимости 4. При r(xy)=0 лин кор связи м/д признаками не сущ-ет (при этом может быть нелинейная кор связь)
Статистическая гипотеза. Статистический критерий.
Статистической называют гипотезу о виде неизвестного распределение или о параметрах известных распределений. Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной. Простой называют гипотезу, содержащую, только 1 предположение. СЛОЖНОЙ – гипотезу. Которая сост из конечного или бесконечного числа простых гипотез. Стат критерий – случайная величина К, которая служит для проверки нулевой гипотезы.
Ошибки первого и второго рода, уровень значимости.
В результате проверки гипотезы могут быть допущены ошибки двух родов. Ошибка 1 рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность ошибки 1 рода называется уровнем значимости и обозначается α. Ошибка 2 рода состоит в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки 2 рода обозначается β и называется риск два.
Критическая область и область принятия гипотезы. Критические точки.
Критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают. Область принятия гипотезы – совокупность значений критерия, при которых нулевую гипотезу не отклоняют. ТИПЫ критических областей. Правосторонней называют критическую обл, определяемую нер-вом К>k кр, где k кр>0 ГРАФИК
Левосторонней называют критическую область, определяемую нер-вом К<k кр, где k кр<0 ГРАФИК
Двусторонней называют критическую обл, определяемую нер-вом К<k1, К>k2, где k1<k2 ГРАФИК
|
||
Последнее изменение этой страницы: 2018-05-29; просмотров: 291. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |