Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Качественный анализ факторов для отбора в экономико-математическую модель




Построение радов распределения и расчет их характеристик дают возможность провести предварительный качественный анализ связи каждого фактора-аргумента исходной экономико-математической модели с фактором-функцией.

В качественном анализе взаимосвязи факторов используют следующие статистические методы: сопоставление параллельных рядов, аналитические группировки, таблицы и поля корреляции.

При использовании метода сопоставления параллельных рядов вначале в порядке возрастания или убывания в зависимости от характера исследуемого процесса записываются значения фактора-аргумента. Затем параллельно им располагаются соответствующие значения фактора-функции. Сравнение расположенных таким образом значений дает возможность выявить существование и направленность связи.

Используем указанный метод для выявления связи между одним из аргументов рассматриваемой экономико-математической модели – стажем рабочего  и функцией – процентом выполнения норм выработки станочников механического цеха  (таблица 2).

 

Таблица 2 – Сопоставление процентов выполнения норм выработки станочников механического цеха и данных общего стажа их работа

Номер рабочего Номер рабочего Номер рабочего
49 1 186 44 11 176 2 26 230
41 2 145 8 13 157 9 29 169
48 2 149 3 13 169 18 29 170
36 2 159 4 14 157 20 30 210
42 3 149 31 14 176 39 31 145
45 4 169 50 14 175 28 31 182
15 5 145 27 15 168 1 31 200
13 5 148 17 16 169 40 31 220
22 5 169 46 16 176 23 32 169
10 6 168 24 17 169 26 32 181
32 7 150 19 20 158 47 32 192
6 7 168 30 21 145 21 33 175
14 7 169 43 21 225 16 33 240
25 10 158 5 22 152 12 34 204
33 10 164 29 24 158 11 37 175
35 11 145 37 24 176 34 38 220
38 11 159 7 24 199      

 

Просматривая два параллельных ряда (первый ранжирован по ), можно заметить, что с возрастанием  растет и , правда не во всех случаях. Следовательно, можно предположить между  и  не полную прямую зависимость. Для ее выявления используем другие названные выше статистические приемы.

Метод аналитических группировок считается в статистике основным для изучения связей медку экономическими факторами. Он позволяет выявить корреляционную зависимость более отчетливо. Процесс установления связи между явлениями начинается с группировки единиц по фактору-аргументу. Затем для фактора-функции по группам, на которые была разбита исходная выборка, вычисляют средние значения.

Искусство группировок в корреляционно-регрессионном анализе заключается в том, чтобы образовать такое количество групп (интервалов), при котором в вариации групповых средних в максимальной степени проявилось бы влияние группировочного признака. Для этого следует использовать формулу определения оптимальной величины интервала в построении ряда распределения по фактору-аргументу с учетом следующего правила А.А. Чупрова: "Чем больше групп мы в состоянии нарезать, не наталкиваясь ни на одно исключение, тем прочнее вывод о наличии связи, т.е. оптимальное число групп имеет место в том случае, когда групповые средние перестанут носить случайный характер и в то же время группировочный признак проявит себя в полной мере".

Переход от исходного дискретного ряда к интервальному, т.е. процесс группировки, осуществляется на основе расчета оптимальной величины интервала по формуле:

                                    (14)

В приведенном примере расчетная оптимальная величина интервала для ряда распределения фактора-аргумента составит

Расчетное значение величины интервала следует округлить до ближайшего числа того же порядка, что и значения исходной выборки. В данном случае это 5 и 6. В соответствии с этими величинами интервалов получаем две возможные группировки с числом групп 8 и 7. Результаты группировок представлены в таблице 3.

 

Таблица 3 – Группировки данных общего стажа работы станочников механического цеха

 

Номер

группы

1 0-5 9 1419 157,7 0-6 10 1587 158,7
2 5-10 8 977 162,8 6-12 8 1289 161,1
3 10-15 9 1481 164,6 12-18 9 1515 173,8
4 15-20 4 672 168 18-24 7 1213 173,3
5 20-25 6 1055 175,8 24-30 4 779 194,8
6 25-30 4 779 194,8 30-36 10 1908 190,8
7 30-35 10 1908 190,8 36-42 2 395 197,5
8 35-40 2 395 197,5        

Итого…

50 8686 - - 50 8686 - —

* - число наблюдений(частота) в к-й группе;

** - средняя арифметическая в к-й группе.

 

Заметим, что при определении границ интервалов необходимо начинать построение ряда, отступая на 0,5 принятой величины интервала влево от наименьшего значения признака, и заканчивать ряд, отступая на 0,5 этой величины вправо от наибольшего значения признака. Так, в первой группировке нижняя граница интервального ряда определится следующим образом: 1 – 0,5·5 = 0. Если какое-либо значение признака совпадает с границей интервала, его следует относить в ту группу, для которой оно является верхней границей.

Условие Чупрова выдерживается в обеих группировках, так как величины интервалов не намного отличаются друг от друга.

Но с учетом того же правила Чупрова целесообразнее принять первую группировку с большим числом групп. В ней по изменению средних значений фактора-функции  отчетливо прослеживается прямая связь между общим стажем работы станочников механического цеха и процентом выполнения ими норд выработки.

Наиболее часто для установления корреляционной зависимости используют корреляционную таблицу. Она систематизирует результаты статистической выборки по двум варьирующим признакам и охватывает два зависимых ряда распределения: один ряд распределения представляет фактор-аргумент, а другой – фактор-функцию. Корреляционная таблица может обеспечить наиболее правильную характеристику связи только в том случае, когда число интервалов по двум признакам примерно одинаковое.

Составим корреляционную таблицу для рассматриваемого примера (таблица 4). Число интервалов по  равно 8, тогда число интервалов по
 должно быть тоже примерно равно 8. Определим по формуле (14) оптимальную величину интервала для :

Если взять = 14, то количество интервалов по  составит 8.

 

Таблица 4 – Корреляционная таблица процентов выполнения норм выработки станочников механического цеха и данных общего стажа их работы

 

Интервалыпо

Интервалыпо

Итого

0-5 5-10 10-15 15-20 20-25 25-30 30-35 35-40
236-250 1 1
222—236 1 1 2
208-222 1 1 1 3
194-208 1 2 3
180-194 1 3 4
166-180 2 3 5 3 1 2 2 1 19
152-166 1 2 3 1 1 8
138-152 5 1 1 2 1 10
Итого… 9 6 9 4 6 4 10 2 50

 

Внутренние клетки таблицы содержат частоты, т.е. показывают число станочников, оказавшихся в соответствующих интервалах по и . Подведены горизонтальные и вертикальные итоги частот и указан общий итог 50. Станочники первых вертикальных рядов имеют  наименьшие значения общего стажа работы, т.е. фактора . По процентам выполнения норм выработки эти станочники также находятся на низком уровне. При переходе слева направо, от меньшего стажа работы к большему, наблюдается смещение рядов распределения функции , причем с увеличением  растет и . Следовательно, имеет место прямая связь  и .

Корреляционная таблица делает возможной оценку интенсивности связи. Интенсивная концентрация частот около диагонали указывает на существование тесной связи между факторами, а рассеивание частот по всей таблице – на отсутствие связи. В рассматриваемом примере связь между факторами  и  имеет место, но назвать ее интенсивной нельзя.

На основании корреляционной таблицы строят графическое изображение связи в виде поля корреляции. Поле корреляции строится в прямоугольной системе координат: по оси абсцисс откладывают значения фактора-аргумента, а по оси ординат – значения функции. Указав точками в системе координат значения зависимой и независимой переменных по каждому наблюдению исходной выборки, получают изображение поля корреляции. Поскольку графическое изображение связи в корреляционном поле имеет обычно вид облака точек, графический метод исследования связи иногда называют методом "точечного облака". Заметим, что в каждой внутренней клетке поля проставляется то количество точек, которое соответствует частоте идентичной клетки корреляционной таблицы. Дня рассматриваемого примера поле корреляции показано на рисунке 3.

 

 

Рисунок 3 – Поле корреляции процентов выполнения норм выработки станочников механического цеха и данных общего стажа их работы

 

Поле корреляции дает в основном представление о наличии и направлении связи (прямая или обратная). Поэтому его целесообразно дополнить построением эмпирической линии регрессии, которая позволяет более наглядно спрогнозировать форму связи между исследуемыми факторами.

Корреляционная зависимость, как известно, выражается в закономерном смещении рядов распределения фактора-функции при изменении фактора-аргумента. Ранее уже отмечалось, что положение рядов распределения обусловливается значениями различных характеристик и, в частности, значениями средних величин.

Поэтому для точной оценки положений рядов распределения функции определяются ее средние значения в каждой груше . Для данного примера значения , соответствующие каждому интервалу по аргументу , приведены в таблице 3. Значения  в виде точек заносятся на поле корреляции, для чего из середины интервалов по восстанавливаются ординаты, соответствующие    (рисунок 4). Вершины ординат (на рисунке 4 изображены знаком "♦" ) последовательно соединяют прямыми линиями. Полученная ломаная линия и называется эмпирической линией регрессии. Она показывает, как в среднем изменяется функция при изменении аргумента.

 

 

Рисунок 4 – Эмпирическая линия регрессии в поле корреляции процентов выполнения норм выработки станочников механического цеха и данных общего стажа их работы

 

Эмпирическая линия регрессии показывает наличие прямой связи между процентами выполнения норм выработки станочников механического цеха и их общим стажем их работы. Однако связь эта не тесная, так как зигзаги линии регрессии не дают возможности "рассмотреть" прямую или какую-либо кривую, к которой линия регрессии стремится. Такое положение объясняется тем, что на проценты выполнения норм выработки станочников в большей мере, чем стаж их работы, влияют другие факторы, прежде всего объективные: фондовооруженность, энерговооруженность, уровень механизации труда и другие. Эти факторы своим действием затушевывают анализируемую зависимость. Поэтому более точно характер зависимости устанавливают на последующих этапах корреляционно-регрессионного анализа методами математической статистики.

Таким же образом строят поля корреляции функции и всех других аргументов, включенных в исходную экономико-математическую модель. В рассматриваемом примере это зависимости процентов выполнения норм выработки станочников  и их возраста , а также процентов выполнения норм выработки станочников и их законченного образования . Построенные для этих зависимостей поля корреляции и эмпирические линии регрессии показали наличие прямой связи между каждым аргументом и функцией.

Если эмпирическая линия регрессии идет параллельно оси аргумента, т.е. смещения рядов распределения функции по данному аргументу не наблюдается, такой аргумент следует исключить из исходной экономико-математической модели.

 










Последнее изменение этой страницы: 2018-05-10; просмотров: 245.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...