Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Генеральная и выборочная совокупности. Виды выборки. Способы отбора.




Выборочной совокупностью или просто выборкой называется совокупность случайно отобранных объектов.

Генеральная совокупность – совокупность объектов, из которых производится выборка.

Объем совокупности (выборочной или генеральной) – число объектов этой совокупности.

Замечание: часто ген совокуп-ть содержит конечное число объектов. Однако если это число достаточно велико, то иногда в целях упрощения вычислений, или для облегчения теоретических выводов, допускают, что ген совокуп-ть состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема ген совокуп-ти (достаточно большого объема) практически не сказывается на результатах обработки данных выборки.

ВИДЫ ВЫБОРКИ

Повторная – выборка, при которой отобранный объект (перед отбором следующего) возвращается в ген совокуп-ть.

Бесповторная – выборка, при которой отобранный объект не возвращается в ген совокуп-ть.

На практике обычно пользуются безповт случайным отбором.

Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке ген совокуп-ти, выборка должна правильно представлять пропорции ген совокуп-ти. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если её осуществить случайно: каждый объект выборки отобран случайно из ген совокуп-ти, если все объекты имеют одинаковую в-ть попадания в выборку.

Если объем ген совокуп-ти достаточно велик, а выборка составляет лишь незначительную часть этой совокуп-ти, то различие м/д повторной и бесповторной выборками стирается; в предельном случае, когда рассматривается бесконечная ген совокуп-ть, а выборка имеет конечный объем, это различие исчезает.

СПОСОБЫ ОТБОРА

1.  Отбор, не требующий расчленения ген совокуп-ти на части: простой случайный бесповторный и повторный отборы.

ПРОСТОЙ случайный – это отбор, при котором объекты извлекают по одному из всей ген совокуп-ти. (пользуются выбором наугад и таблицами «случайных чисел»)

2. Отбор, при котором ген совокуп-ть разбивается на части.

а) Типический – отбор, при котором объекты отбираются не из всей ген совокуп-ти, а из каждой её «типической» части (детали на станках, продукция каждого станка в отдельности). Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях ген совокуп-ти.

б) Механический – отбор, при котором ген совокуп-ть механически делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы выбирают один объект (если 20% - каждая 5ая деталь, 5% - каждая 25ая).

в) Серийный – отбор, при котором объекты выбирают из ген совокуп-ти не по одному, а сериями, которые подвергаются сплошному исследованию. Пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.

На практике часто применяется комбинированный метод.

Статистическое распределение выборки. Полигон и гистограмма.

 

Пусть из ген совокуп-ти извлечена выборка, причем х1 наблюдалось n1 раз, х2-n2 раз, xk-nk раз и СУММА ni=n – объем выборки. Наблюдаемые значения xi называются вариантами, а послед-ть вариант, записанных в возрастающем порядке – вариационным рядом. Числа наблюдений называют частотами, а их отношения к объему выборки n1/n=Wi – относительными частотами.

Статистическое распределение выборки – перечень вариант и соответствующих им частот или относительных частот. Стат распред-е можно задать также в виде послед-ти интервалов и соответствующих им частот (в кач-ве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).

В теории в-ти под распред-ем понимают соответствие м/д возможными значениями СВ и их в-тями, а в мат статистике – соответствие м/д наблюдаемыми вариантами и их частотами или относит частотами.

ПОЛИГОН частот – ломаная, отрезки которой соединяют точки (x1; n1), (x2; n2),…, (xk; nk). Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат – соответствующие им частоты (относит частоты).

Для того, чтобы определить вид з-ов распред-я, полигон частот сравнивают с графиками ф-ии плотности известных з-ов распред-я

ГРАФИКИ

 

В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал.

Гистограммой частот называется фигура, составленная из прямоугольников, площади которых равны частоте попадания значений признака в основание прямоугольника.

ГИСТОГРАММА – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, ||ые оси абсцисс на расстоянии ni/h.

Площадь i-го частичного прямоугольника равна hni/h=ni – сумме частот вариант i-го интервала; => площадь гистограммы частот равна сумме всех частот, т.е. объему выборки. Площадь гистограммы относит частот равна сумме всех относит частот, т.е. единице.

 

Эмпирическая функция распределения, ее свойства.

 

Пусть задано стат распред-е частот колич-го признака Х, nx – число наблюдений, при котором значение признака X<x.

Эмпирическая ф-ия распред-я – ф-ия F*(x), определяющая относит частоту события, что X<x.

F*(x)= nx/n, где n – объем выборки.

СВОЙСТВА

1. Ф-ия неубывающая

2. Значения ф-ии 0<=F*(x)<=1

3. Если х1 – наименьшая варианта, то F*(x)=0 при x<=x1; если xk – наибольшая варианта, то F*(x)=1 при x>xk.

Эмпирическая ф-ия распред-я выборки служит для оценки теоретич ф-ии распред-я ген совокуп-ти.

ПРИМЕР xi-2-6-10 ni-12-18-30 n=12+18+30=60

Наименьшая варианта =2 => F*(x)=0 при x<2. Значение Х<6 (xi=2) наблюдалось 12 раз => F*(x)=12/60=0,2 при 2<x<6. Значение Х<10 (xi=2, 6) наблюдалось 12+18=30 раз => F*(x)=30/60=0,5 при 6<x<10. Так как х=10 – наибольшая варианта, то F*(x)=1 при x>10.

Искомая эмпирическая ф-ия F*(x)=СИСТЕМА (0, при x<2; 0,2 при 2<x<6; 0,5 при 6<x<10; 1 при x>10).

ГРАФИК

 

 

Статистические оценки параметров распределения. Несмещенные, эффективные и состоятельные оценки.

 

Пусть необходимо изучить количественный признак ген совокуп-ти. Допустим, удалось установить вид распределения, возникает задача оценки параметров данного распределения.

Статистической оценкой неизвестного параметра распределения называют ф-ию от наблюдаемых СВ

Пусть Q* - стат оценка неизвестного параметра, Q – оцениваемый параметр.

Для того, чтобы оценки давали хорошее приближение к оцениваемым параметрам они должны обладать следующими свойствами:

1. Несмещенная – стат оценка Q*, мат ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т.е. M(Q*)=Q.

Смещенная – оценка, мат ожидание которой не равно оцениваемому параметру.

2. Эффективная – стат оценка, которая (при заданном объеме выборки n) имеет наименьшую дисперсию.

3. Состоятельная – оценка, которая при n -> к беск стремится по в-ти к оцениваемому параметру. НАПР., если дисперсия несмещенной оценки при n -> к беск стремится к 0, то такая оценка оказывается и состоятельной.

 

 










Последнее изменение этой страницы: 2018-05-29; просмотров: 212.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...