Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Пример выполнения лабораторной работы.




Лабораторная работа №1.

Простейшая обработка данных. Линейная регрессия.

Коэффициент корреляции. Его значимость

Цель: научиться находить коэффициент корреляции и определятьего начимость; находить коэффициенты регрессии и строить уравнениерегрессии.

 

Основные сведения

Парная регрессия – это уравнение связи двух переменных у и х:

y=f(х),

где у – зависимая переменная (результат, отклик);

х – независимая, объясняющая переменная (фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия: .

Построение уравнения регрессии сводится к оценке ее параметров.Для оценки параметров регрессий, линейных по параметрам, используютметод наименьших квадратов (МНК). МНК позволяет получить такиеоценки параметров, при которых сумма квадратов отклоненийфактических значений результативного признака у от теоретических уxминимальна.

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно а и в:

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

.

Параметр b называется коэффициентом регрессии. Его величинапоказывает среднее изменение результата с изменением фактора на однуединицу.

Тесноту связи изучаемых явлений оценивает линейный коэффициентпарной корреляции  rxyдля линейной регрессии

Теснота линейной связи между переменными может быть оценена на основании шкалы Чеддока:

Теснота связи

Значение коэффициента корреляции при наличии:

Прямой связи Обратной связи
Слабая 0,1 – 0,3 (– 0,3) – (– 0,1)
Умеренная 0,3 – 0,5 (– 0,5) – (– 0,3)
Заметная 0,5 – 0,7 (– 0,7) – (– 0,5)
Высокая 0,7 – 0,9 (– 0,9) – (– 0,7)
Весьма высокая 0,9 – 1 (– 1) – (– 0,9)

 

Положительное значение коэффициента корреляции говорит оположительной связи между х и у, когда с ростом одной из переменныхдругая тоже растет. Отрицательное значение коэффициента корреляцииозначает, с ростом одной из переменных другая убывает, с убываниемодной из переменной другая растет.

Оценку статистической значимости коэффициента корреляциипроводят с помощью t-критерия Стьюдента. Выдвигают гипотезу Н0 остатистически незначимом отличии коэффициента от нуля. Оценказначимости коэффициента корреляции с помощью t-критерия Стьюдентапроводится путем сопоставления его значения с величиной случайнойошибки:

tr=r/mr.

Стандартная (случайная) ошибка коэффициента корреляцииопределяется по формуле:

.

Сравнивая фактическое и табличное (критическое) значенияt-статистики –tтабл. и  tфакт.– принимает или отвергаем гипотезу Н0.

Если tтабл. < tфакт., то гипотеза Н0 отклоняется, коэффициенткорреляции не случайно отличается от. Если tтабл. > tфакт, то гипотеза Н0 не отклоняется и признается случайная природа формирования коэффициента корреляции.

 

Порядок выполнения работы.

По заданной выборке исследовать зависимость результата у от фактора х. Для этого

1. Создать таблицу данных.

2. Найти средние значения , выборочные дисперсии  исправленные средние квадратические отклонения .

3. Найти коэффициент корреляции и проверить его значимость.

4. Найти коэффициенты линейного уравнения регрессии.

5. Построить график прямой регрессии.

 

Пример выполнения лабораторной работы.

В табл. 1.1 приведены данные об объеме производства у (тыс.ед.) в зависимости от численности занятых х (тыс.чел.) некоторой фирмы.

Таблица 1.1.

Исходные данные

x 11 13 15 18 20 22 24 25 27
y 15 17 21 20 28 33 34 32 29

 

1. В диапазоне В3:C11 подготовим исходные данные.

 

 

2. Вводим следующие формулы:

Ячейка Формула Примечание
D3 =B3*C3 Копируем диапазон D3:D11
E3 =B3*B3 Копируем диапазон E3:E11
F3 =C3*C3 Копируем диапазон F3:F11
B12 =СРЗНАЧ(B3:B11) Копируем диапазон B12:F12
A17 =E12 – B12*B12 Выборочная средняя фактора
B17 =F12 – C12*C12 Выборочная средняя результата
A20 =СТАНДОТКЛОН(B3:B11) Исправленное среднее квадратическое отклонение фактора
B20 =СТАНДОТКЛОН(С3:С11) Исправленное среднее квадратическое отклонение результата

 

Получим следующие результаты (см. рис. 1.1).

Рис. 1.1. Результаты простейшей обработки данных

 

3. Для определения коэффициента корреляции воспользуемся формулой . Для этого в ячейку Е16вводим формулу

=(D12-B12*C12)/КОРЕНЬ(A17*B17)

Из расчетов следует, что коэффициент корреляции r=0,97. Этосвидетельствует о том, что связь между объемом выпуска продукции ичисленностью занятых весьма высокая и положительная.

4. Для проверки значимости коэффициента корреляции введемвспомогательные данные:

Ячейки

К169 число предприятий;

К170,05 уровень значимости.

 

 

5. Далее вводим следующие формулы:

H19 =КОРЕНЬ((1-E16*E16)/(K16-2)) Стандартная ошибка
H20 =E16/H19 t - статистика
H21 =СТЬЮДРАСПОБР(K17;K16 – 2) Критическое значение                   t - статистики
H22 =ЕСЛИ(ABS(H20)>H21; «Значим»; «Незначим») Вывод

 

 

Таким образом, получим данные, представленные на рис 1.2.

Рис. 1.2. Анализ значимости коэффициента корреляции

 

6. Для определения коэффициентов уравнения линейной регрессии на

основе формул

следует в ячейки I3, I4ввести соответственно следующие формулы:

=(D12-B12*C12)/A17;

=C12-I3*B12.

Уравнение регрессии у=7,9+1,47х.

Значение коэффициента b=1,47 говорит о том, что при увеличениичисленности занятых на 1 тыс.чел. объем продукции увеличится на1,74 тыс.ед.

Результаты расчетов приведены на рис.1.3.

Рис. 1.3. Результаты расчетов

 

7. Дляпостроения графика выделим диапазон В3:С11. ВызовемМастер диаграмм. Чтобы ось отражала фактические данные,выберем тип диаграммы Точечная.После чего нажмем кнопкуГотово. На построенной диаграмме выделим график функции,щелкнув по нему левой кнопкой мыши. Выделение обозначаетсясветлыми маркерами на функции. Нажав правую кнопку мыши,выведем контекстно-зависимое меню, в котором выберем опциюДобавить линию тренда. В окне Линия трендапо вкладке Типвыберем тип функции Линейная, а во вкладке Параметры–установим флажок показывать уравнение на диаграмме. Врезультате на диаграмме появиться вид теоретической кривой –тренда и ее уравнение (рис.1.4).

 

 

Рис. 1.4. Графики фактических данных и построенной регрессии

 

 

8. Вычисление параметров регрессии с помощью статистическихфункций Excel:

КОРРЕЛ(массив1;массив2) вычисляет коэффициент корреляциимежду двумя переменными; значения первой из них приведены вдиапазоне массив1, значения второй – в диапазоне массив2;

НАКЛОН(известные_значения_y;известные_значения_x)служитдля определения коэффициента b;

ОТРЕЗОК(известные_значения_y;известные_значения_x)служит для определения коэффициента a.

Вводим формулы:

C27 =КОРРЕЛ(B3:B11;C3:C11) Коэффициент корреляции
C28 =НАКЛОН(С3:С11;B3:B11) Коэффициент b
C29 =ОТРЕЗОК(C3:C11;B3:B11) Коэффициент a

 

Встроенная статистическая функция ЛИНЕЙНопределяетпараметры линейной регрессии. Порядок вычислений следующий:

1) выделите область пустых ячеек 5х2 (5 строк, 2 столбца) с цельювывода результатов регрессионной статистики (А27:В3);

2) в главном меню выберите Вставка/Функция;

3) в строке Категория(рис.1.5) выберите Статистические, в окнеФункцияЛИНЕЙН. Щелкните ОК.

Рис. 1.5. Диалоговое окно «Мастер функций»

 

4) Заполните аргументы функции (рис.1.6.):

 

Известные_значения_у – диапазон, содержащий данныерезультативного признака;

 

Известные_значения_х – диапазон, содержащий данные факторовнезависимого признака;

 

Константа – логическое значение, которое указывает на наличиеили на отсутствие свободного члена в уравнении; если Константа = 1, тосвободный член рассчитывается обычным образом, если Константа = 0,то свободный член равен 0.

 

Статистика – логическое значение, которое указывает выводитьдополнительную информацию по регрессионному анализу или нет. ЕслиСтатистика = 1, то дополнительная информация выводится, еслиСтатистика = 0, то выводится только оценки параметров уравнения.Далее ОК.

Рис.1.6. Диалоговое окно ввода аргументов функции ЛИНЕЙН

5) В левой верхней ячейке выделенной области появится первыйэлемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите наклавишу F2,а затем – на комбинацию клавиш CTRL+SHIFT+ENTER.Дополнительная регрессионная статистика будет выводиться в порядке,указанном в следующей схеме:

Значение коэффициента Значение коэффициента
Среднеквадратическое отклонение Среднеквадратическое отклонение
Коэффициент детерминации Среднеквадратическое отклонение y
F - статистика Число степеней свободы
Регрессионная сумма квадратов Остаточная сумма квадратов

 

Результаты регрессионного анализа представлены на рис.1.7.

Рис. 1.7.Результаты регрессионного анализа

 










Последнее изменение этой страницы: 2018-04-12; просмотров: 232.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...