Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Вычислить основные статистические характеристики заданной выборки.




Лабораторная работа № 7

РАСЧЕТ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК

 ДЛЯ ДАННЫХ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ

 И ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ

Цель работы: научиться анализировать экспериментальные данные с помощью статистических методов и устанавливать корреляционные зависимости между различными биологическими процессами и явлениями. В качестве примера можно рассмотреть задачу оценки процентного количества испорченных овощей и фруктов в 20 разных хранилищах и описание зависимости этого количества от параметров хранения (влажность, температура, состав воздуха и т.д.)

 

Теоретическая справка

Построение статических функций распределения, числовые характеристики выборки, интервальные оценки параметров распределения, проверка гипотезы о нормальном законе распределении генеральной совокупности по критерию Пирсона, Элементы корреляционно-регрессионного анализа.

Набор значений  случайных величин, полученных в результате опытов называется выборкой объема n.

Наблюдающиеся значения  признака Х называются вариантами.

Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом.

Статистическим распределением выборки называется перечень вариант  вариационного ряда и соответствующих им частот  или относительных частот .

Плотность относительных частот – это величина  – это частота приходящаяся на единицу длины интервала.

Эмпирическая функция распределения (или приближение теоретической функции построенной с помощью заданной выборки экспериментальных данных)  , где  – число вариантов эксперимента, меньших х, n – объем выборки.

Свойства эмпирической функции:

1) ;

2)  – неубывающая функция;

3) если  – наименьшая, а  – наибольшая варианта, то  для , , для .

Полигон частот – это ломаная линия, соединяющая точки .

Гистограмма относительных частот – это ступенчатая функция, состоящая из прямоугольников с основанием  и высотой .

Среднее значение случайной величины рассчитывается по формуле .

Дисперсия случайной величины  или .

Исправленная дисперсия .

Среднее квадратичное отклонение случайной величины .

Размах выборки .

Коэффициент вариации .

Рассмотренные оценки называются точечными, так как определяются одним числом.

Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый интервал.

Интервальная оценка математического ожидания (m) при известном среднем квадратичном отклонении (s) имеет вид

,

где  точность оценки,

n объем выборки,

 значение аргумента функции Лапласа, при котором  (значения данной функции находятся по таблице). Число b называется доверительной вероятностью, как правило, оно принимает значения 0,95; 0,99; 0,999. При вычислении точности оценки D в Excel используется функция =ДОВЕРИТ(1-b; s; n)

 

Задание 1.Себестоимость единицы одноименной продукции на предприятиях пищевой отрасли характеризуется следующими показателями (табл. 15)


Таблица 15

Себестоимость единицы продукции, р 1,6-2,0 2,0-2,4 2,4-2,8 2,8-3,2 3,2-3,6 3,6-4,0
Число предприятий 2 3 5 7 10 3

 

Необходимо проанализировать деятельность предприятий отрасли по снижению себестоимости продукции, найти среднюю себестоимость и стоимостной разброс, выяснить число предприятий, выпускающих продукцию с минимальной, средней и максимальной себестоимостью. Для этого требуется найти все точечные статистические характеристики выборки, построить гистограмму и полигон. Найти с надежностью 0,95 доверительный интервал для себестоимости единицы продукции по предприятиям всей отрасли.


Порядок выполнения работы

1. Ввести границы интервала ai = (1,6; 2,0; 2,4; 2,8; 3,2; 3,6; 4,0) рис. 7.1.

2. Рассчитать среднее значение для каждого интервала xi (середина интервала (a1+a2)/2).

3. Ввести соответствующие им частоты mi* – число предприятий (звездочкой будем обозначать результаты эксперимента).

4. Вычислить сумму частот mi* .

5. Вычислить относительные частоты .


 

 

A

B

C

D

E

F

G

H

I

6

ai

1,6

2,0

2,4

2,8

3,2

3,6

4,0

 

7

 

xi

1,8

2,2

2,6

3

3,4

3,8

сумма

8

 

mi

2 3 5 7 10

3

30

9

 

Pi

0,067

0,100

0,167

0,233

0,333

0,100

1

10

 

f*

0,167

0,250

0,417

0,583

0,833

0,250

 

11

 

F*

0,067

0,167

0,333

0,567

0,900

1,000

 

12

 

xi*mi

3,60

6,60

13,00

21,00

34,00

11,40

89,6

13

 

среднее значение

2,9867

 

 

 

 

14

 

(xi сред.знач)^2*mi

2,816

1,85653

0,7476

0,0012

1,7084

1,9845

9,1147

15

 

дисперсия

0,3038

 

 

 

 

16

 

исправленная дисперсия^2

0,3143

 

 

 

 

17

 

среднее квадратичное отклонение

0,5512

 

 

 

 

18

 

коэффициент вариации

18,46%

 

 

 

 

19

 

дельта

0,1972

 

 

 

 

20

 

нижняя граница доверит. интервала

2,7894

 

 

 

 

21

 

верхняя граница доверит. интервала

3,1839

 

 

 

 

Рис. 7.1


6. Для построения гистограммы вычислить значения плотности относительных частот , где  – длина интервала, равная 0,4 (рис. 7.1).

7. Построить гистограмму по значениям (хi, fi*) рис. 7.2. Отредактировать диаграмму, используя команды «Формат ряда данных / Параметры / Ширина зазора» (установить 0).

Рис. 7.2

 

8. Вычислить значения функции распределения , , ,  и т.д. (последнее значение должно равняться 1).

9. Построить график – гистограмму функции распределения по значениям (хi, Fi*) рис.7.3.

 

Рис. 7.3

 

10. Для вычисления среднего значения случайной величины  добавить строку  и найти сумму полученных значений. Окончательный результат получить, разделив найденную сумму на сумму частот mi* (рис. 7.1).

11. Для вычисления дисперсии случайной величины  добавить строку  и найти сумму полученных значений. Окончательный результат получить, разделив найденную сумму на сумму частот mi* (рис. 7.1).

12. Найти исправленную дисперсию  (рис. 7.1).

13. Найти среднее квадратичное отклонение случайной величины  (рис. 7.1).

14. Найти коэффициент вариации  (рис. 7.1).

15. Вычислить интервальную оценку , для чего сначала найти , используя функцию Excel =ДОВЕРИТ(1-b; s; n), где b = 0,95, а s; n найдены в пунктах 4, 13. Затем вычислить оценку справа и слева (рис. 7.1).

 

Задание 2.Рассмотрим возможности пакета Excel для анализа данных в виде выборки 40 значений. (Набор значений  случайной величины Х, полученных в результате опытов, называется выборкой объема n.) Решим задачу оценки процентного количества испорченных овощей и фруктов в 20 разных хранилищах, которое зависит от параметров хранения (влажность, температура, состав воздуха и т.д.)

Наблюдающиеся значения  случайной величины Х представлены в табл. 16.

Таблица 16

Х 10 11 10 9 12 11 13 14 14 15 16 16 17 15 14 19 18 20 18 19

продолжение

Х 12 15 16 18 19 18 20 18 16 14 11 10 12 14 17 18 17 15 11 10

 



Решение

Вычислить основные статистические характеристики заданной выборки.

Ввести нумерацию данных № и все данные Х в один столбик (всего 40 значений).

Выбрать команды «Сервис / Анализ данных / Описательная статистика» (если пакет анализа данных отсутствует в команде «сервис», то следует его установить с помощью команд «Сервис / Надстройка»)

Выделить входные данные (т.е. значения Х), если данные выделены с заголовком, то отметить команду «Метки» в первой строке.

Выходной интервал – это ячейка, с которой будет начинаться вывод результата, или несколько ячеек.

Выбрать команды «Итоговая статистика» и «Интервал надежности».

Результат представлен на рис. 7.4.


 

Х

 

 

Среднее

15,025

Стандартная ошибка

0,49158

Медиана

15

Мода

18

Стандартное отклонение

3,109023

Дисперсия выборки

9,666026

Эксцесс

-1,182109

Асимметричность

-0,196937

Интервал

10

Минимум

10

Максимум

20

Сумма

601

Счет

40

Уровень надежности(95,0%)

0,994314

Рис. 7.4

 

Если метку не ставили, то вместо Х на рис. 7.4 будет выведена надпись «первый столбец» (строка).

Данная команда вычислила все главные статические характеристики выборки.

 

2. Построение гистограммы.

Выбрать команды «Сервис / Анализ данных / Гистограмма», выделить исходные значения Х и место для вывода (можно одну начальную ячейку), указать вывод интегрального процента и графика.

При выполнении этой команды данные будут автоматически разбиты на интервалы, будет вычислена середина каждого интервала и будет найдено количество значений, попадающих в каждый интервал (частота), затем построена гистограмма.

Рассмотрим полученный ответ рис. 7.5

 

Карман

Частота

Интегральный %

10

4

10,00%

11,66666667

4

20,00%

13,33333333

4

30,00%

15

9

52,50%

16,66666667

4

62,50%

18,33333333

10

87,50%

Еще

5

100,00%

Рис. 7.5

 

Карман – это представитель интервала (середина).

Частота – количество значений Х попадающих в указанный карман.

Интегральный % – это накопленные частоты в %.

Выбрать команды «Сервис / Анализ данных / Гистограмма», выделить исходные значения Х и новое место для вывода (лучше ниже полученных данных), указать вывод команды «Парето», выполнить. В результате найденные частоты будут расставлены в порядке убывания.

 

В данной процедуре карманы вычислялись произвольно, исправим это. Рассмотрим интервалы, исходя из полученных статических характеристик: максимум – 20, минимум – 10. Выберем интервалы: скопируем Х на новый лист, введем значения интервалов 10, 12, 14, 16, 18, 20 (интервал карманов).

Выбрать команды «Сервис / Анализ данных / Гистограмма», выделить исходные значения Х, интервал карманов и место для вывода (можно одну начальную ячейку), указать вывод интегрального процента и графика.

В полученных данных изменить формат ячеек интегрального процента на числовой, 2 знака после запятой и удалить его график с гистограммы.

На гистограмме убрать ширину зазоров («Формат ряда данных / Параметры / Зазор 0»).

Построить отдельно график полигона накопленных частот: выделить данные (столбец Интегральный) рис. 7.5, выбрать «Диаграмма / График / График с накоплением» рис. 7.6.

 

Рис. 7.6

 

Отдельно рассчитаем относительные частоты (в столбце рядом с интегральными). Для этого нужно разделить значение частоты на их количество (на 40) рис. 7.7.

 

Карман

Частота

Интегральный %

относительные частоты

10

4

0,10

0,1

12

7

0,28

0,175

14

6

0,43

0,15

16

8

0,63

0,2

18

10

0,88

0,25

20

5

1,00

0,125

Еще

0

1,00

 

Рис. 7.7

 

Построить отдельно график полигона относительных частот «Диаграмма / График / График с накоплением»рис. 7.8.

Рис. 7.8

 










Последнее изменение этой страницы: 2018-06-01; просмотров: 223.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...