Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Фиктивные переменные в регрессионной модели 3 страница




    4) Отсутствие автокорреляции остатков.Выполнение данной предпосылки проверим методом Дарбина–Уотсона. Предварительно ряд остатков на рабочем листе EXCEL упорядочивается в зависимости от последовательно возрастающих значений Y, предсказанных уравнением регрессии. Для этой цели в «Выводе остатка» выделяется любая ячейка в столбце «Предсказанное Y», и на панели инструментов нажимается кнопка «Сортировка по возрастанию».

    Для расчета d‑статистики используется выражение, составленное из встроенных функций «СУММКВРАЗН» и «СУММКВ»:

=СУММКВРАЗНОстатки 2, …, n»;«Остатки 1, …, n–1»)/СУММКВ(«Остатки 1, …, n»)

    В результате получим d=2,01. Критические границы d‑статистики для числа наблюдений n=27, числа факторов p=4 и уровня значимости a=0,05 составляют: d1=1,08; d2=1,76. Так как выполняется условие

,

статистическая гипотеза об отсутствии автокорреляции в остатках не отклоняется на уровне значимости a=0,05.

    Проверим отсутствие автокорреляции в остатках также и по коэффициенту автокорреляции остатков первого порядка, для расчета которого в EXCEL может использоваться следующее выражение:

=СУММПРОИЗВОстатки 2,…, n»;«Остатки 1,…, n–1»)/СУММКВ(«Остатки 1, …, n»)

    Ряд остатков упорядочен в той же самой последовательности, что и при расчете d‑статистики. Коэффициент автокорреляции остатков первого порядка равен r(1)=–0,078.    Критическое значение коэффициента автокорреляции для числа наблюдений n=27 и уровня значимости a=0,05 составляет r(1)кр=0,381. Так как r(1) не превышает по абсолютной величине критическое значение, то это еще раз указывает на отсутствие автокорреляции в остатках.

    5) Нормальный закон распределения остатков. Выполнение этой предпосылки проверяем с помощью R/S-критерия

,

где emax=558,7 тыс. руб.; emin=–430,3 тыс. руб. — наибольший и наименьший остатки соответственно (определялись с помощью встроенных функций «МАКС» и «МИН»); Se=218,5 тыс. руб. — стандартное отклонение ряда остатков (определено с помощью встроенной функции «СТАНДОТКЛОН»).

    Критические границы R/S-критерия для числа наблюдений n=27 и уровня значимости a=0,05 имеют значения: (R/S)1=3,34 и (R/S)2=4,71. Так как R/S‑критерий попадает в интервал между критическими границами, то это означает, что статистическая гипотеза о нормальном законе распределения остатков не отклоняется на уровне значимости a=0,05.

    Таким образом, выполняются четыре из пяти предпосылок обычного метода наименьших квадратов. Это говорит о том, что регрессионная модель не вполне адекватна исследуемому экономическому явлению, и использовать ее для целей анализа и прогнозирования годовой прибыли страховой компании следует с некоторой долей осторожности.

    8. Рассчитаем прогнозное значение годовой прибыли, если прогнозные значения факторов составят 75 % от своих максимальных значений в исходных данных. Максимальные значения определяем с помощью встроенной функции EXCEL «МАКС». Прогнозные значения рассчитываем только для количественных факторов X2, X3, X4:

· фактор Х2:  тыс. руб.;

· фактор Х3:  тыс. руб.;

· фактор Х4:  тыс. руб.

    Среднее прогнозируемое значение годовой прибыли государственных компаний (x06=0) равно:

    Для частных компаний (x06=1) этот показатель равен

    9. Построим доверительный интервал прогноза фактического значения годовой прибылиc надежностью 80 %.

    Стандартная ошибка прогноза фактического значения годовой прибыли y0 для определенных в предыдущем пункте прогнозных значений факторов рассчитывается по формуле

.

    Так как фиктивная переменная Х6 может принимать два значения — 0 или 1, то  определим для обоих случаев:

– для государственных компаний (x06=0):

– для частных компаний (x06=1):

    Построим доверительные интервалы прогноза фактического значения результата y0 с доверительной вероятностью g=0,8 (уровень значимости a=0,2):

,

где tтаб — табличное значение t-критерия Стьюдента при уровне значимости a=0,2 и числе степеней свободы  составляет tтаб=1,321.

    Интервальный прогноз для государственных компаний имеет вид:

 тыс. руб.

    Таким образом, с вероятностью 80 % годовая прибыль государственных компаний будет находиться в интервале от 272,4 до 945,4 тыс. руб.

    Для частных компаний интервальный прогноз:

 тыс. руб.

    С вероятностью 80 % годовая прибыль частных компаний будет находиться в интервале от 499,1 до 1173,7 тыс. руб.

Пример 3.2

    Исследуется зависимость доходности акций компании (зависимая переменная Y, %) от доходности рынка (фактор X1, %). Имеются данные за пятнадцать кварталов:

Квартал Y X1
1 4,3 6,8
2 2,8 0,1
3 1,2 11,7
4 4,2 5,1
5 -3,2 4,6
6 -4,2 -8,9
7 6,9 10,2
8 6,4 5,1
9 6,5 6,2
10 9,4 1,2
11 3,2 -3,5
12 -3,6 -3,1
13 6,2 4,2
14 7,5 6,5
15 12,3 5,6

Требуется:

1. Построить линейную регрессионную модель доходности акций компании, включив в нее в качестве фактора фактор времени. Оценить параметры этой модели.

2. Проверить статистическую значимость уравнения регрессии и его коэффициентов на уровне значимости a=0,05.

3. Проверить временной ряд остатков на наличие автокорреляции.

    Решение

    1. Регрессионная модель строится по временным рядам переменных, которые могут иметь свои тенденции. Для исключения «ложной» корреляции между переменными целесообразно номер квартала (первый столбец таблицы исходных данных) считать независимой переменной t.

    Проверим факторы X1 и t на коллинеарность, для чего с помощью EXCEL строим матрицу парных коэффициентов корреляции (табл. 3.9).

Таблица 3.9

Результаты корреляционного анализа в EXCEL

 

Y

X1

t

Y

1

 

 

X1

0,490

1

 

t

0,413

-0,142

1

        Коэффициент корреляции между Х1 и t не превышает по абсолютной величине 0,8, что свидетельствует об отсутствии коллинеарности. Поэтому можно попробовать построить двухфакторную модель (табл. 3.10).

Таблица 3.10

Результаты регрессионного анализа в EXCEL

 

Регрессионная статистика

Множественный R

0,691

R-квадрат

0,478

Нормированный R-квадрат

0,391

Стандартная ошибка

3,75

Наблюдения

15

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

154,0

77,0

5,49

0,0203

Остаток

12

168,4

14,0

 

 

Итого

14

322,4

 

 

 

Уравнение регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-1,94

2,23

-0,872

0,400

X1

0,495

0,186

2,658

0,021

t

0,528

0,226

2,336

0,038

                   

Уравнение регрессии имеет вид:

.

    2. Коэффициент детерминации R2=0,478 показывает, что 47,8 % вариации годовой прибыли Y объясняется изменчивостью включенных в модель факторов X1 и t. Дисперсионный анализ уравнения регрессии свидетельствует о его статистической значимости в целом на уровне a=0,05. Статистически значимыми являются и коэффициенты уравнения при факторах Х1 и t (см. табл. 3.10).

    Значение коэффициента при Х1, показывает, что при увеличении доходности рынка на 1 % доходность акций увеличивается в среднем на 0,495 %. Статистическая значимость коэффициента при факторе времени t свидетельствует о наличии тенденции во временном ряду переменной Y: воздействие всех факторов, кроме доходности рынка, на доходность акций приводит к ее среднему приросту за квартал на 0,528 %.

    3. Проверим отсутствие автокорреляции во временном ряду остатков методом Дарбина–Уотсона. В табл. 3.11 приводятся временные ряды предсказанных уравнением регрессии значений результата Y, остатков и стандартизированных (стандартных) остатков (получены в EXCEL при проведении регрессионного анализа).

    Предварительно проверим остатки на наличие выбросов. Видно, что ни один из стандартных остатков не превышает по абсолютной величинетабличное значение t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка регрессии , которое составляет tтаб=2,179.

Таблица 3.11

Вывод остатка

 

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1

1,95

2,35

0,678

2

-0,84

3,64

1,048

3

5,43

-4,23

-1,220

4

2,69

1,51

0,434

5

2,98

-6,18

-1,781

6

-3,17

-1,03

-0,296

7

6,80

0,10

0,028

8

4,81

1,59

0,459

9

5,88

0,62

0,179

10

3,94

5,46

1,576

11

2,14

1,06

0,306

12

2,87

-6,47

-1,864

13

7,00

-0,80

-0,232

14

8,67

-1,17

-0,337

15

8,75

3,55

1,023

    При расчете d‑статистики остатки остаются упорядоченными по времени. d‑статистика определяется с помощью выражения, приведенного в предыдущем примере. Она оказалась равной d=2,02. Критические значения d‑статистики для числа наблюдений n=15, числа факторов p=2 и уровня значимости a=0,05 составляют: d1=0,95; d2=1,54. Так как выполняется условие

,

статистическая гипотеза об отсутствии автокорреляции в остатках не отклоняется на уровне значимости a=0,05.

    Автокорреляция возмущений модели, как указывалось в § 3.8, может быть вызвана и неправильным выбором формы регрессионной зависимости. Поэтому d‑статистику целесообразно рассчитать ипо ряду остатков, упорядоченному в зависимости от последовательно возрастающих значений Y, предсказанных уравнением регрессии. В этом случае d‑статистика будет равна d=1,90, и статистическая гипотеза об отсутствии автокорреляции в остатках также не отклоняется.

Пример 3.3

    Имеется временной ряд прибыли предприятия за девять лет (переменная Y, млн. руб.):

Год 1999 2000 2001 2002 2003 2004 2005 2006 2007
t 1 2 3 4 5 6 7 8 9
yt 37 39 54 56 54 55 68 65 75

    Требуется:

1. Построить трендовую линейную модель прогнозирования прибыли.

2. Проверить статистическую значимость уравнения регрессии и его коэффициентов на уровне значимости a=0,05.

3. Проверить временной ряд остатков на отсутствие выбросов, автокорреляции и соответствие нормальному закону распределения.

4. Оценить точность уравнения регрессии.

5. Спрогнозировать значение прибыли предприятия на 1 год вперед с надежностью 90 %.

    Решение

    1. Независимой переменной в трендовой модели является фактор времени t (здесь — номер года). Уравнение регрессии строим с помощью EXCEL (табл. 3.12). Оно имеет вид:

.

Таблица 3.12

Результаты регрессионного анализа в EXCEL

 

Регрессионная статистика

Множественный R

0,940

R-квадрат

0,884

Нормированный R-квадрат

0,868

Стандартная ошибка

4,537

Наблюдения

9

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

1100,8

1100,8

53,49

0,00016

Остаток

7

144,1

20,6

 

 

Итого

8

1244,9

 

 

 

Уравнение регрессии

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

34,47

3,30

10,459

1,590E-05

t

4,283

0,586

7,313

1,609E-04

                   

    2. Уравнение регрессии статистически значимо на уровне a=0,05. Это свидетельствует о наличии наличие линейного тренда во временном ряду. Коэффициент детерминации R2=0,884 показывает, что изменение во времени прибыли предприятия на 88,4 % описывается линейной моделью. Статистически значимыми оказались и оба коэффициента уравнения регрессии. Коэффициент при факторе времени показывает, что за один год прибыль предприятия увеличивается в среднем на 4,283 млн. руб. (см. табл. 3.12).

    3. При проведении регрессионного анализа в EXCEL были получены предсказанные уравнением регрессии значения Y, остатки и стандартные остатки (табл. 3.15).

Таблица 3.13

Вывод остатка

 

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1

38,76

-1,76

-0,414

2

43,04

-4,04

-0,952

3

47,32

6,68

1,574

4

51,61

4,39

1,036

5

55,89

-1,89

-0,445

6

60,17

-5,17

-1,219

7

64,46

3,54

0,835

8

68,74

-3,74

-0,881

9

73,02

1,98

0,466

    Ни один из стандартных остатков не превышает по абсолютной величине табличное значение t-критерия Стьюдента tтаб=2,365 (a=0,05 и ), что свидетельствует об отсутствии аномальных наблюдений (выбросов).

    d‑статистика Дарбина–Уотсона имеет значение d=2,34. Критические значения d‑статистики для числа наблюдений n=9 и уровня значимости a=0,05 составляют: d1=0,82; d2=1,32. Так как выполняется условие

,

то статистическая гипотеза об отсутствии автокорреляции в остатках не отклоняется на уровне значимости a=0,05.

    R/S‑критерий определяется по формуле

,

где emax=6,68 млн. руб.; emin=–5,17 млн. руб. — наибольший и наименьший остатки соответственно; Se=4,24 млн. руб. — стандартное отклонение ряда остатков (определено с помощью встроенной функции «СТАНДОТКЛОН»).

    Критические границы R/S-критерия для числа наблюдений n=9 и уровня значимости a=0,05 имеют значения: (R/S)1=2,59 и (R/S)2=3,55. Видно, что расчетное R/S-критерий попадает в интервал между критическими границами, и статистическая гипотеза о нормальном законе распределения остатков, таким образом, не отклоняется на уровне значимости a=0,05.

    4. Оценим точность модели через стандартную ошибку регрессии Sрег=4,537 млн. руб. (см. табл. 3.12). Средняя относительная ошибка аппроксимации равна

 %,

где  млн. руб. — средний уровень временного ряда переменной Y.

    Точность модели — достаточно высокая: предсказанные уравнением регрессии значения прибыли отличаются от фактических значений в среднем на 6,5 %.

    5. Построим точечный и интервальный прогнозы прибыли предприятия на 1 год вперед (период упреждения k=1). Среднее прогнозируемое значение прибыли предприятия в следующем году составляет:

 млн. руб.

    Интервальный прогноз с доверительной вероятностью 0,9 имеет вид:

где tтаб=1,895 — табличное значение t-критерия Стьюдента для a=0,1 и .

    С вероятностью 90 % фактическое значение прибыли предприятия в следующем году будет находиться в интервале от 66,67 (оптимистический прогноз) до 87,93 млн. руб. (пессимистический прогноз).

Пример 3.4

    По тринадцати предприятиям ЖКХ города исследуется зависимость годовой прибыли (зависимая переменная Y, тыс. у.е.) от числа обслуживаемых участков (фактор X1), количества рабочих высокой квалификации (фактор X2, чел.) и формы собственности:

Номер предприятия

Y

X1

X2

Форма собственности

1

726

14

75

частная

2

550

8

36

частная

3

429

4

55

муниципальная

4

439

4

51

муниципальная

5

646

10

79

муниципальная

6

507

10

53

муниципальная

7

834

13

62

частная

8

579

9

56

частная

9

701

16

45

частная

10

532

14

49

муниципальная

11

281

8

53

муниципальная

12

349

5

45

муниципальная

13

625

10

68

муниципальная

    Требуется:










Последнее изменение этой страницы: 2018-04-12; просмотров: 550.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...