Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Фиктивные переменные в регрессионной модели 2 страница




    Видно, что расчетное значение F-статистики Фишера

превышает табличное (см. «F» втабл. 3.4), что свидетельствует о статистической значимости уравнения регрессии в целом. На этот же факт указывает и то, что вероятность случайного формирования уравнения регрессии в том виде, в котором оно имеется, составляет 8,20×10-6 (см. «Значимость F» втабл. 3.4), что ниже допустимого уровня значимости a=0,05.

    Проверим статистическую значимость коэффициентов уравнения регрессии при факторах Х1, Х2, …, Х6 с помощью t-критерия Стьюдента:

.

    Табличное значение t-критерия Стьюдента можно определить с помощью встроенной функции EXCEL «СТЬЮДРАСПОБР» (см. § 5.4). Для уровня значимости a=0,05 и числа степеней свободы остатка df=dfост=20 оно составляет tтаб=2,086. Анализ данных в табл. 3.4показывает, что табличное значение t‑критерия Стьюдента превышают по абсолютной величине t-статистики коэффициентов при факторах Х4, Х6, и эти коэффициенты признаются статистически значимыми. На тот же самый факт указывают и значения вероятности случайного формирования коэффициентов, которые ниже допустимого уровня значимости a=0,05 (см. «P-Значение»втабл. 3.4).

    Что касается факторов Х1, Х2, Х3 и Х5 (выделены в табл. 3.4 заливкой), то t‑статистики их коэффициентов меньше по абсолютной величине табличного значения t-критерия Стьюдента, а «P-Значение» выше уровня a=0,05. Данные коэффициенты не признаются статистически значимыми.

    3. Как было показано в пункте 1, факторы Х1 и Х3 являются коллинеарными и фактически дублируют друг друга. Их одновременное включение в модель приведет к неправильной интерпретации соответствующих коэффициентов уравнения регрессии. Поэтому модель с полным перечнем факторов, построенная при выполнении предыдущего пункта, не вполне корректна. Из указанных коллинеарных факторов фактор Х3 имеет больший по абсолютной величине коэффициент корреляции с результатом Y: ; ;  (см. табл. 3.3). Кроме того, в уравнении регрессии с полным перечнем факторов t‑статистика коэффициента при факторе Х3 ( ) больше по абсолютной величине t-статистики коэффициента при факторе Х1 ( ). Все это свидетельствует о более сильном влиянии фактора Х3 на изменение зависимой переменной Y. Фактор Х1, таким образом, исключается из рассмотрения и вторая модель будет содержать факторы X2, X3, X4, X5 и X6. По аналогии с пунктом 2 строим второе уравнение регрессии (табл. 3.5):

.

    Уравнение регрессии признается статистически значимым, так как вероятность его случайного формирования (8,80×10-6) существенно ниже принятого уровня значимости a=0,05. Вероятности случайного формирования коэффициентов при факторах Х3, Х4, Х6 ниже уровня a=0,05, что свидетельствует об их статистической значимости (см. табл. 3.5). Что касается факторов Х2 и Х5 (выделены в табл. 3.5 заливкой), то «P‑Значение» их коэффициентов выше уровня a=0,05. Эти коэффициенты не признаются значимыми.

Таблица 3.5

Результаты регрессионного анализа модели Y(X2, X3, X4, X5, X6)

 

Регрессионная статистика

Множественный R

0,868

R-квадрат

0,753

Нормированный R-квадрат

0,694

Стандартная ошибка

242,3

Наблюдения

27

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

5

3749838,2

749967,6

12,78

8,80E-06

Остаток

21

1232466,8

58688,9

 

 

Итого

26

4982305,0

 

 

 

Уравнение регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

487,5

641,4

0,760

0,456

X2

-0,0456

0,0373

-1,224

0,235

X3

0,1043

0,0194

5,375

0,00002

X4

-0,0965

0,0263

-3,674

0,001

X5

2,528

6,323

0,400

0,693

X6

248,2

113,0

2,197

0,039

                   

    4. По результатам выполнения предыдущего пункта строим новую регрессионную модель, содержащую только информативные факторы. Такими факторами считаются те, у коэффициентов которых t‑статистика превышает по абсолютной величине единицу, т.е. абсолютная величина коэффициента больше его стандартной ошибки — факторы X2, Х3, Х4, Х6. Фактор X5 исключается из рассмотрения как неинформативный ( ). Результаты регрессионного анализа приведены в табл. 3.6. Само уравнение регрессии имеет вид:

.

    Статистически значимыми являются уравнение регрессии в целом и коэффициенты при факторах Х3, Х4, Х6 (см. табл. 3.6). Это свидетельствует о существенном влиянии данных факторов на изменение годовой прибыли Y.

    Коэффициент при факторе Х2 не является статистически значимым (выделен в табл. 3.6 заливкой). Однако этот фактор можно считать информативным, так как t‑статистика его коэффициента превышает по абсолютной величине единицу, хотя к дальнейшим выводам относительно Х2 следует относиться с некоторой осторожностью.

Таблица 3.6

Результаты регрессионного анализа модели Y(X2, X3, X4, X6)

 

Регрессионная статистика

Множественный R

0,866

R-квадрат

0,751

Нормированный R-квадрат

0,705

Стандартная ошибка

237,6

Наблюдения

27

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4

3740456,2

935114,1

16,57

2,14E-06

Остаток

22

1241848,7

56447,7

 

 

Итого

26

4982305,0

 

 

 

Уравнение регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

712,2

303,0

2,351

0,028

X2

-0,0541

0,0300

-1,806

0,085

X3

0,1032

0,0188

5,476

0,00002

X4

-0,1017

0,0223

-4,560

0,00015

X6

227,5

98,5

2,310

0,031

                   

    5. В таблице результатов регрессионного анализа имеются и другие статистические характеристики уравнения регрессия, в частности, множественный коэффициент детерминации , скорректированный (нормированный) коэффициент детерминации  и стандартная ошибка регрессии  тыс. руб. (см. «Регрессионную статистику» в табл. 3.6).

    Значение коэффициента детерминации R2 показывает, что регрессионная модель объясняет 75,1 % вариации годовой прибыли Y страховой компании, причем эта вариация обусловлена изменчивостью включенных в модель факторов X2, X3, X4 и X6. Скорректированный коэффициент детерминации  превышает 0,5, что свидетельствует об удовлетворительном качестве модели.

    Оценим точность уравнения регрессии через среднюю относительную ошибку аппроксимации, определяемую по приближенной формуле

,

где  тыс. руб. — среднее значение прибыли (функция «СРЗНАЧ»).

    Значение Еотн показывает, что предсказанные уравнением регрессии значения результата Y отличаются от фактических значений в среднем на 26,7 %. Точность последней модели — удовлетворительная ( ).

    6. Дадим экономическую интерпретацию коэффициентам уравнения регрессии. Для удобства сведем в таблицу средние значения и стандартные отклонения переменных Y, X2, X3, X4, X6 в исходных данных (табл. 3.7). Средние значения определялись с помощью встроенной функции «СРЗНАЧ», а стандартные отклонения — с помощью функции «СТАНДОТКЛОН».

Таблица 3.7

Средние значения и стандартные отклонения переменных Y, X2, X3, X4, X6

 

Переменная

Y

X2

X3

X4

X6

Среднее

713,0

5980,6

7334,0

5327,6

0,481

Стандартное отклонение

437,8

1575,7

2671,9

2120,5

0,509

1) Фактор X2 (годовой размер страховых резервов)

    Значение коэффициента b2=–0,0541 показывает, что рост годового размера страховых резервов на 1 тыс. руб. приводит к снижению годовой прибыли страховой компании в среднем на 0,0541 тыс. руб.

    Средний коэффициент эластичности фактораX2 имеет значение

.

    Это означает, что при увеличении годового размера страховых резервов на 1 % годовая прибыль уменьшается в среднем на 0,454 %.

2) Фактор X3 (годовой размер страховых премий)

    Коэффициент b3=0,1032 показывает, что рост годового размера страховых премий на 1 тыс. руб. приводит к увеличению годовой прибыли в среднем на 0,1032 тыс. руб.

    Средний коэффициент эластичности

показывает, что при увеличении годового размера страховых премий на 1 % годовая прибыль увеличивается в среднем на 1,062 %.

3) Фактор X4 (годовой размер страховых выплат)

    Значение коэффициента b4=–0,1017 показывает, что рост годового размера страховых выплат на 1 тыс. руб. приводит к уменьшению годовой прибыли в среднем на 0,1017 тыс. руб.

    Средний коэффициент эластичности фактораX4 равен

.

    Значение E4 показывает, что при увеличении годового размера страховых выплат на 1 % годовая прибыль уменьшается в среднем на 0,760 %.

4) Фактор X6 (форма собственности)

    Коэффициент b6=227,5 тыс. руб. при фиктивной переменной X6 (форма собственности: 0 — государственная, 1 — частная) статистически значим на уровне значимости a=0,05. Это свидетельствует о существенной разнице в размере годовой прибыли государственных и частных компаний. В среднем годовая прибыль у частных компаний при прочих равных условиях на 227,5 тыс. руб. больше, чем у государственных. Средний коэффициент эластичности для фиктивной переменной лишен смысла, поэтому и не рассчитывается.

    Сравним между собой силу влияния включенных в модель факторов на годовую прибыль, для чего определим их бета–коэффициенты:

;

;

;

.

    Сравнивая их по абсолютной величине, можно сделать вывод, что на изменение годовой прибыли Y сильнее всего влияет изменение годового размера страховых премий Х3, далее по степени влияния следуют годовой размер страховых выплат Х4, форма собственности X6 и размер страховых резервов X2.

    Определим квадраты бета-коэффициентов:

;

;

;

.

    Они показывают, что чистая вариация только годового размера страховых резервов X2 объясняет 3,8 % вариации годовой прибыли Y, чистая вариация годового размера страховых премий Х3 — 39,7 % вариации Y, а чистая вариация годового размера страховых выплат Х4 — 24,3 % вариации Y. Форма собственности объясняет 6,9 % вариации годовой прибыли Y.

    Определим дельта–коэффициенты факторов:

;

;

;

,

где ; ; ;  — парные коэффициенты корреляции между переменными (см. табл. 3.3).

    Сумма дельта-коэффициентов факторов, включенных в модель должна быть равна единице. Небольшое неравенство вызвано погрешностями промежуточных округлений. Таким образом, в суммарном влиянии на годовую прибыль Y всех факторов, включенных в модель, доля влияния годового размера страховых резервов X2 составляет 7,1 %, размера страховых премий Х3 — 51,2 %, размера страховых выплат Х4 — 37,5 %, формы собственности Х6 — 4,1 %.

    7. При проведении регрессионного анализа в EXCEL можно получить предсказанные уравнением регрессии значения результата Y, остатки и стандартизированные (стандартные) остатки (табл. 3.8).

Таблица 3.8

Вывод остатка

 

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1

1442,3

-430,3

-1,969

2

547,6

-85,6

-0,392

3

1827,0

219,0

1,002

4

505,7

22,3

0,102

5

500,0

-82,0

-0,375

6

668,1

145,9

0,667

7

503,3

24,7

0,113

8

723,2

178,8

0,818

9

527,4

-32,4

-0,148

10

529,3

-23,3

-0,107

11

704,6

10,4

0,048

12

439,0

-120,0

-0,549

13

544,6

-170,6

-0,781

14

1060,2

-334,2

-1,529

15

929,4

104,6

0,479

16

773,5

-289,5

-1,325

17

1509,3

558,7

2,556

18

446,0

104,0

0,476

19

725,8

-285,8

-1,308

20

666,5

169,5

0,776

21

501,7

48,3

0,221

22

758,5

165,5

0,757

23

155,9

361,1

1,652

24

710,3

-182,3

-0,834

25

925,4

-188,4

-0,862

26

184,5

156,5

0,716

27

440,9

-44,9

-0,206

    На рис. 3.6 показан график остатков ei от предсказанных уравнением регрессии значений результата  (i=1, 2, …, n), построенный с помощью надстройки «Мастер диаграмма» EXCEL (см. § 5.1).

Рис. 3.6. График остатков

    Проверим выполнение предпосылок метода наименьших квадратов.

    1) Случайный характер остатков. Проверим исходные данные на наличие аномальных наблюдений годовой прибыли Y (выбросов). С этой целю сравним абсолютные величиныстандартных остатковс табличным значением t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка регрессии , которое составляет tтаб=2,074.

    Видно, что только стандартный остаток, соответствующий наблюдению 17 (компания «С») превышает по абсолютной величинетабличное значение t‑критерия. Вполне возможно, что это наблюдение является выбросом, и следовало бы попробовать построить модель регрессии без этого наблюдения.

    Визуальный анализ графика остатков не выявляет в них какой-либо явной закономерности.

    2) Нулевая средняя величина остатков. Данная предпосылка всегда выполняется для линейных моделей со свободным коэффициентом b0, параметры которых оцениваются обычным методом наименьших квадратов.

    3) Одинаковая дисперсия (гомоскедастичность) остатков. Выполнение данной предпосылки проверим методом Глейзера в предположении линейной зависимости среднего квадратического отклонения возмущений s(ei) от предсказанных уравнением регрессии значений результата  (i=1, 2, …, n). Для этого рассчитаем коэффициент корреляции  между абсолютными величинами остатков  и значениями  (i=1, 2, …, n) с помощью выражения, составленного из встроенных функций:

=КОРРЕЛ(ABS(Остатки);Предсказанное_Y)

    Этот коэффициент корреляции оказался равным .

    Критическое значение коэффициента корреляции для уровня значимости a=0,05 и числа степеней свободы  составляет rкр=0,381. Видно, что коэффициент корреляции  превышает по абсолютной величине критическое значение, и статистическая гипотеза об одинаковой дисперсии остатков отклоняется на уровне значимости a=0,05. Положительное значение коэффициента корреляции указывает на то, что годовая прибыль более крупных компаний имеет существенно большую вариацию.

    Невыполнение предпосылки об одинаковой дисперсии остатков свидетельствует о том, что данная модель не вполне адекватна, а оценки параметров модели обычным методом наименьших квадратов могут не быть эффективными. Вполне возможно, что если из исходных данных удалить наблюдение 17, которое, как указывалось выше, может быть выбросом, то предпосылка будет выполнена (попробуйте проверить это самостоятельно).=).










Последнее изменение этой страницы: 2018-04-12; просмотров: 499.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...