Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Построение эмпирической функции распределения




ЭЛЕМЕНТЫ ТЕОРИИ

Из продукции одного токарно-револьверного автомата, обрабатывающего ролики d = 20 мм, взята выборка объемом 100 шт. Ролики измерены по диаметру микрометром с ценой деления 0,01 мм и результаты измерений приведены ниже.

19,81 19,83- 19,84- 19,85- 19,86+ 19,83- 19,84- 19,85-
19,86+ 19,86+ 19,82- 19,84- 19,84- 19,87+ 19,88+ 19,83-
19,84- 19,86 19,85+ 19,86+ 19,82- 19,85- 19,84- 19,80-
19,88+ 19,85- 19,84- 19,85- 19,87+ 19,86+ 19,85+ 19,84+
19,85- 19,87+ 19,86+ 19,82- 19,84- 19,83- 19,86+ 19,85+
19,83- 19,85- 19,84- 19,87+ 19,89+ 19,85+ 19,84- 19,86+
19,85+ 19,87+ 19,81- 19,83- 19,82- 19,83- 19,82- 19,85-
19,85 19,82- 19,83+ 19,85+ 19,83+ 19,84+ 19,84+ 19,84-
19,85 19,84+ 19,84+ 19,83- 19,84+ 19,84 19,84 19,85+
19,84- 19,85+ 19,84 19,85+ 19,85+ 19,84 19,85+ 19,85
19,86+ 19,87+ 19,86+ 19,80- 19,86+ 19,86+ 19,85 19,87+
19,86 19,86- 19,86 19,88+ 19,86 19,88+ 19,87+ 19,87
19,86 19,89+ 19,87+ 19,84-        

 

Рассматриваемая нами случайная величина Х может принять любое значение из некоторого интервала, то есть является непрерывной случайной величиной.

Решение вопросов математической статистики (установить закон распределения, определить параметры, проверить гипотезу) по данным выборки слагается из следующих пунктов:

1 Проверка случайности и независимости результатов наблюдений (проверка выборки на стохастичность).

2 Построение эмпирической функции распределения.

3 Вычисление точных оценок параметров распределения (выборочной средней, выборочной дисперсии, показателя асимметрии, показателя эксцесса).

4 Вычисление интервальных оценок.

5 Построение теоретической функции распределения.

6 Проверка гипотезы о виде распределения.

Проверка выборки на стохастичность

Пред тем как подвергнуть результаты наблюдений соответствующей статистической обработке, необходимо убедиться, что они образуют случайную выборку.

С этой целью воспользуемся критерием «восходящих» и «нисходящих» серий. В этом критерии исследуется последовательность знаков – плюсов и минусов. Исходным пунктом является выборка х1, х2, … хn (в приведенном примере значения признака).

На i – ом месте этой выборки ставится плюс, если Хi+1 Xi> 0, минус, если хi+1 xi< 0.(Если хin= хi,то значение хiпропускается).

В приведенном примере мы получим следующую последовательность знаков:

+-+--+-+-+-+-+-+++-+--+-+--++++--+--+-+-+-+-+--+-+-++++-+-+-+-+++-+-++--+++---+++--++

Под «серией» будем понимать последовательность подряд идущих плюсов или минусов. В частности, «серия» может состоять только из одного плюса или одного минуса, тогда ее протяженность равна единице.

Общее число, серий в выборке обозначим через n(n), протяженность самой длинной серии – t(n).

Для нашего примера n =100; n(n) = 59; t(n) = 4.

При уровне значимости a = 0,05 количественное выражение правила проверки на случайность следующее:

                                                        (1)

t(n) <t0(n),

где t0(n) определяется из соотношений:

n: n£ 26 26 <n£ 153 153 <n£ 1170
t0(n) 5 6 7

Если хотя бы одно из неравенств (1) не выполняется, то предположение о случайности выборки следует отвергнуть; так как 26 < n < 153, то t0(n) = 6>t(n), то есть второе неравенство выполняется. Проверим первое неравенство.

.

Так как выполнено и второе неравенство, то в приведенном примере выборка случайная.

Построение эмпирической функции распределения

При большом объеме выборки (порядка сотен) простая статистическая совокупность престает быть удобной формой записи статистического материала - она становится громоздкой и мало наглядной. Для придания большей компактности элементы выборки объединяют в группы (интервалы), число которых колеблется от 5 до 40, в зависимости от объема выборки.

Гост II.006-74 по правилам согласия опытного распределения с теоретическим рекомендует следующее число интервалов К в зависимости от объема выборки n:

при n = 200 K = 18 ¸ 20,
при n = 400 K = 25 ¸ 30,
при n = 1000 K = 35 ¸ 40.

Некоторые авторы для определения числа интервалов рекомендуют пользоваться эмпирическими формулами:

  или .

Просматривая результаты испытаний, выбираем наибольшее и наименьшее наблюдаемые значения признака X(xmax, xmin) и находим величину размаха варьирования

.

Зная число интервалов и размах варьирования R, находим длину каждого интервала h по формуле

.

В рассмотренном примере:

хmin= 19,80; xmax= 19,89; R = xmax– хmin= 0,09.

Значение К =10 подсчитано по формуле .

Тогда h = 0,009.

Чтобы значение признака попадало на границу интервала, длину интервала увеличивают до h = 0,011.

Далее приступают к заполнению таблицы 1.

В колонке 1 записаны полученные интервалы, расположенные в порядке возрастания значений признака.

В колонке 2 отмечено наличие признака, попавшего в рассматриваемый интервал (для облечения подсчета количества значений признака их группируют по 5). Количество m (абсолютная частота признака) записывают в колонку 3.

В колонке 4 записывают относительные частоты  значений признака.

Таблица 1.

Интервалы Наличие признака в интервале Абсолютные частоты Относительные частоты
1 2 3 4
19,79– 19,801 II 2 0,02
19,801– 19,812 II 2 0,02
19,812– 19,823 IIIII 6 0,06
19,823– 19,834 IIIIIIII 10 0,1
19,834 – 19,845 IIIIIIIIIIIIIIIIIII 23 0,23
19,845– 19,856 IIIIIIIIIIIIIIIIIII 23 0,23
19,856 – 19,867 IIIIIIIIIIIIIII 18 0,18
19,867–19,878 IIIIIIII 10 0,1
19,878–19,889 IIII 4 0,04
19,889– 19,90 II 2 0,02

 

Данные таблицы 1 используют для графического изображения статистического ряда либо в виде гистограммы, либо в виде эмпирической функции распределения. Это графическое изображение позволяет представить в наглядной форме закономерности, присущие генеральной совокупности.

Для построения гистограммы (рисунок 1) на оси абсцисс последовательно откладываются интервалы изменения значения признака. На этих отрезках, как на основании, строят прямоугольники с высотами, равными  соответствующего интервала. Полученная ступенчатая фигура называется гистограммой.

Рисунок 1 – Гистограмма

График эмпирической функции распределения (рисунок 2) строят в координатах (х, ) либо (х,  ),

где x – значения признака;

 - накопленная абсолютная частота.

Под значением признака понимают середины рассматриваемых интервалов, а под накопительной частотой – сумму частот всех предшествующих и рассматриваемого интервалов.

x 19,7955 19,8065 19,8175 19,8285 19,8395
2 4 10 20 43
х 19,8505 19,8615 19,8725 19,8835 19,8945
66 84 94 98 100

Рисунок 2 – Вычисление точных оценок параметров распределения

Статистический ряд – первый шаг к осмыслению ряда наблюдений. Однако на практике этого недостаточно. Статистические ряды, имеющие похожие графические изображения, могут различаться:

1. Эмпирической средней  – значением признака, вокруг которого группируются наблюдения;

2. Средним квадратическим отклонением S - рассеянием наблюдения вокруг эмпирической средней;

3. Показателем ассиметрии Аs, характеризующим скошенность гистограммы;

4. Показателем эксцесса Es, характеризующим островершинность гистограммы.

Перечисленные числовые характеристики называют статистическими. По ним судят о характерных особенностях статистического ряда.

Эти характеристики вычисляются по формулам:

,                                                                                   (2)

где ximi – середина и абсолютная частота i - го интервала;

k – число интервалов.

Для удобства вычислений , S, As, Es иногда используют метод ложного нуля, которым и воспользуемся. Для этого выбираем значения ха, около которого наиболее часто встречается значение признака, тогда

.

Xa=19,84

Обозначим ,

где h – длина интервала, и подставим в последнюю формулу

                          (3)

Для вычисления эмпирической дисперсии S2 используют формулу

      (4)

Показатель асимметрии вычисляют по формуле

(5)

Показатель эксцесса находят по формуле:

(6)

Для удобства вычислений , S, As, Es составляют таблицу 2.

Таблица 2.

xi mi ei eimi ei2mi ei3mi ei4mi
19,7955 19,8065 19,8175 19,8285 2 2 6 10 -4 -3 -2 -1 -8 -6 -12 -10 32 18 24 10 -128 -54 -48 -10 512 162 96 10
19,8395 23 0 0 0 0 0
 19,8505 19,8615 19,8725 19,8835 19,8945 23 18 10 4 2 1 2 3 4 5 23 36 30 16 10 23 72 90 64 50 23 144 270 256 250 23 288 810 1024 1250
å 100   79 383 703 4175

Подставляя данные таблицы 2 в формулы (3) – (6), находим:

=19,849 S2 = 0,0003918 S = 0,0198
As = -0,182 Es= 0,346  

Заметим что для нормального распределения As= Es=0.










Последнее изменение этой страницы: 2018-04-12; просмотров: 477.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...