Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Генеральная и выборочная совокупности. Виды выборки. Способы отбора.
Выборочной совокупностью или просто выборкой называется совокупность случайно отобранных объектов. Генеральная совокупность – совокупность объектов, из которых производится выборка. Объем совокупности (выборочной или генеральной) – число объектов этой совокупности. Замечание: часто ген совокуп-ть содержит конечное число объектов. Однако если это число достаточно велико, то иногда в целях упрощения вычислений, или для облегчения теоретических выводов, допускают, что ген совокуп-ть состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема ген совокуп-ти (достаточно большого объема) практически не сказывается на результатах обработки данных выборки. ВИДЫ ВЫБОРКИ Повторная – выборка, при которой отобранный объект (перед отбором следующего) возвращается в ген совокуп-ть. Бесповторная – выборка, при которой отобранный объект не возвращается в ген совокуп-ть. На практике обычно пользуются безповт случайным отбором. Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке ген совокуп-ти, выборка должна правильно представлять пропорции ген совокуп-ти. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если её осуществить случайно: каждый объект выборки отобран случайно из ген совокуп-ти, если все объекты имеют одинаковую в-ть попадания в выборку. Если объем ген совокуп-ти достаточно велик, а выборка составляет лишь незначительную часть этой совокуп-ти, то различие м/д повторной и бесповторной выборками стирается; в предельном случае, когда рассматривается бесконечная ген совокуп-ть, а выборка имеет конечный объем, это различие исчезает. СПОСОБЫ ОТБОРА 1. Отбор, не требующий расчленения ген совокуп-ти на части: простой случайный бесповторный и повторный отборы. ПРОСТОЙ случайный – это отбор, при котором объекты извлекают по одному из всей ген совокуп-ти. (пользуются выбором наугад и таблицами «случайных чисел») 2. Отбор, при котором ген совокуп-ть разбивается на части. а) Типический – отбор, при котором объекты отбираются не из всей ген совокуп-ти, а из каждой её «типической» части (детали на станках, продукция каждого станка в отдельности). Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях ген совокуп-ти. б) Механический – отбор, при котором ген совокуп-ть механически делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы выбирают один объект (если 20% - каждая 5ая деталь, 5% - каждая 25ая). в) Серийный – отбор, при котором объекты выбирают из ген совокуп-ти не по одному, а сериями, которые подвергаются сплошному исследованию. Пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно. На практике часто применяется комбинированный метод. Статистическое распределение выборки. Полигон и гистограмма.
Пусть из ген совокуп-ти извлечена выборка, причем х1 наблюдалось n1 раз, х2-n2 раз, xk-nk раз и СУММА ni=n – объем выборки. Наблюдаемые значения xi называются вариантами, а послед-ть вариант, записанных в возрастающем порядке – вариационным рядом. Числа наблюдений называют частотами, а их отношения к объему выборки n1/n=Wi – относительными частотами. Статистическое распределение выборки – перечень вариант и соответствующих им частот или относительных частот. Стат распред-е можно задать также в виде послед-ти интервалов и соответствующих им частот (в кач-ве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал). В теории в-ти под распред-ем понимают соответствие м/д возможными значениями СВ и их в-тями, а в мат статистике – соответствие м/д наблюдаемыми вариантами и их частотами или относит частотами. ПОЛИГОН частот – ломаная, отрезки которой соединяют точки (x1; n1), (x2; n2),…, (xk; nk). Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты (относит частоты). Для того, чтобы определить вид з-ов распред-я, полигон частот сравнивают с графиками ф-ии плотности известных з-ов распред-я ГРАФИКИ
В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал. Гистограммой частот называется фигура, составленная из прямоугольников, площади которых равны частоте попадания значений признака в основание прямоугольника. ГИСТОГРАММА – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты). Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, ||ые оси абсцисс на расстоянии ni/h. Площадь i-го частичного прямоугольника равна hni/h=ni – сумме частот вариант i-го интервала; => площадь гистограммы частот равна сумме всех частот, т.е. объему выборки. Площадь гистограммы относит частот равна сумме всех относит частот, т.е. единице.
Эмпирическая функция распределения, ее свойства.
Пусть задано стат распред-е частот колич-го признака Х, nx – число наблюдений, при котором значение признака X<x. Эмпирическая ф-ия распред-я – ф-ия F*(x), определяющая относит частоту события, что X<x. F*(x)= nx/n, где n – объем выборки. СВОЙСТВА 1. Ф-ия неубывающая 2. Значения ф-ии 0<=F*(x)<=1 3. Если х1 – наименьшая варианта, то F*(x)=0 при x<=x1; если xk – наибольшая варианта, то F*(x)=1 при x>xk. Эмпирическая ф-ия распред-я выборки служит для оценки теоретич ф-ии распред-я ген совокуп-ти. ПРИМЕР xi-2-6-10 ni-12-18-30 n=12+18+30=60 Наименьшая варианта =2 => F*(x)=0 при x<2. Значение Х<6 (xi=2) наблюдалось 12 раз => F*(x)=12/60=0,2 при 2<x<6. Значение Х<10 (xi=2, 6) наблюдалось 12+18=30 раз => F*(x)=30/60=0,5 при 6<x<10. Так как х=10 – наибольшая варианта, то F*(x)=1 при x>10. Искомая эмпирическая ф-ия F*(x)=СИСТЕМА (0, при x<2; 0,2 при 2<x<6; 0,5 при 6<x<10; 1 при x>10). ГРАФИК
Статистические оценки параметров распределения. Несмещенные, эффективные и состоятельные оценки.
Пусть необходимо изучить количественный признак ген совокуп-ти. Допустим, удалось установить вид распределения, возникает задача оценки параметров данного распределения. Статистической оценкой неизвестного параметра распределения называют ф-ию от наблюдаемых СВ Пусть Q* - стат оценка неизвестного параметра, Q – оцениваемый параметр. Для того, чтобы оценки давали хорошее приближение к оцениваемым параметрам они должны обладать следующими свойствами: 1. Несмещенная – стат оценка Q*, мат ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т.е. M(Q*)=Q. Смещенная – оценка, мат ожидание которой не равно оцениваемому параметру. 2. Эффективная – стат оценка, которая (при заданном объеме выборки n) имеет наименьшую дисперсию. 3. Состоятельная – оценка, которая при n -> к беск стремится по в-ти к оцениваемому параметру. НАПР., если дисперсия несмещенной оценки при n -> к беск стремится к 0, то такая оценка оказывается и состоятельной.
|
||
Последнее изменение этой страницы: 2018-05-29; просмотров: 212. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |