Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Этап 5. Спектральный анализ временного ряда. Оценка сезонных колебаний. Оценка точности прогнозирования уровня показателя.




Исследуемый показатель – индекс производства резиновых и пластмассовых изделий (в % к предыдущему году). Что можно сразу сказать, глядя на этот график, так это то, что у временного ряда 100% есть сезонность? Что касается тренда, то здесь нужно сделать ряд проверок, чтобы убедиться в его наличии или отсутствии.

Проверка ряда на стационарность.

Гипотеза о равенстве дисперсий.

  volume1 volume 2
Standard deviation 10,5068 11,906
Variance 110,393 141,753
Df 37 76

Ratio of Variances = 0,778771

F-test to Compare Standard Deviations

Null hypothesis: sigma1 = sigma2

Alt. hypothesis: sigma1 NE sigma2

F = 0,778771 P-value = 0,405531

Do not reject the null hypothesis for alpha = 0,05.

Так как P-value>0,05, гипотеза о равенстве дисперсий не отвергается, то есть исследуемый временной ряд стационарен, и тренд в нем отсутствует.

Гипотеза о равенстве средних.

Проверим, постоянна ли средняя на всем временном ряду или нет. Было принято решение разделить выборку в соотношении 1/3 и 2/3. Результаты представлены ниже.

  volume1 volume 2
Count 38 77
Average 101,529 101,782
Standard deviation 10,5068 11,906
Coeff. of variation 10,3486% 11,6976%
Minimum 69,1 63,8

Null hypothesis: mean1 = mean2

Alt. hypothesis: mean1 NE mean2

assuming equal variances: t = -0,111237 

 P-value = 0,911626

Do not reject the null hypothesis for alpha = 0,05.

Так как P-value >0,05, гипотеза о равенстве средних не отвергается, то есть средние равны на всем интервале, что говорит в пользу стационарности и отсутствия тренда в модели!

Анализ автокорреляционных функций.

Из графика автокорреляционной функции явно бросается в глаза цикличность (которую как раз можно интерпретировать как сезонность); на ЧАКФе это менее заметно. Эти функции иллюстрируют нестационарность процесса как факт наличия сезонности, закономерности во временном ряде.

Проверка ряда на случайность.

Проведем 3 теста на случайность элементов временного ряда.

Расчет критерия серий по медиане выборки.

Нулевая гипотеза – ряд случаен.

Альтернативная ряд не случаен.

Runs above and below median

Median = 103,3

Number of runs above and below median = 48

Expected number of runs = 57,4956

Large sample test statistic z = 1,70021

P-value = 0,0890918

Так как P-value>0,05, можно сделать вывод о том, что элементы ряда случайны.

Расчет критерия восходящих и нисходящих серий.

Нулевая гипотеза – ряд случаен.

Альтернативная ряд не случаен.

Runs up and down

Number of runs up and down = 74

Expected number of runs = 76,3333

Large sample test statistic z = 0,408699

P-value = 0,682757

Так как P-value>0,05, можно сделать вывод о том, что элементы ряда случайны.

Тест Бокса-Пирса

Нулевая гипотеза – нет значимых автокорреляций до 24 шага.

Альтернативная гипотеза – есть значимые автокорреляции до 24 шага

Test based on first 24 autocorrelations

Large sample test statistic = 166,065

P-value = 0,0

P-value<0,05, значит, по этому тесту элементы временного ряда неслучайны.

Итог: 1 тест из 3 показал неслучайность элементов временного ряда, что говорит о нестационарности моделируемого процесса в целом и отсутствия трендовой составляющей.

Чтобы окончательно убедиться в том, что тренда в исследуемом временном ряде нет, построим периодограмму и посмотрим, что она будет из себя представлять.

       По периодограмме видно, что временной ряд «очищен» от тренда, так как на графике изображены систематические колебания, а не резкий пик в начале, после которого все идет на спад (так было бы, если бы во временном ряду присутствовал тренд). Все это говорит о том, что можно приступать к моделированию сезонности непосредственно с самого спектрального анализа.

       Для начала определим m (предполагаемый период изменений): по таблице, отображающей значения периодограммы получается, что m=3,96; 

           

        Cumulative Integrated
I Frequency Period Ordinate Sum Periodogram
25 0,217391 4,6 36,8704 6571,96 0,442277
26 0,226087 4,42308 1,51852 6573,48 0,442379
27 0,234783 4,25926 4,8965 6578,37 0,442709
28 0,243478 4,10714 190,49 6768,86 0,455528
29 0,252174 3,96552 2657,68 9426,54 0,634383
30 0,26087 3,83333 174,076 9600,62 0,646098

 

       Такое значение m связано с тем, что последний год (2013) в выборке представлен не полностью, а только 5 месяцами, то есть не полностью: чтобы не искажать этим картину, необходимо убрать последние 5 значений из выборки и перестроить периодограмму. Получилось следующее:

      

        Cumulative Integrated
I Frequency Period Ordinate Sum Periodogram
4 0,037037 27,0 69,7061 145,523 0,0101593
5 0,0462963 21,6 7,02361 152,546 0,0106496
6 0,0555556 18,0 7,11645 159,663 0,0111464
7 0,0648148 15,4286 20,1159 179,779 0,0125508
8 0,0740741 13,5 118,826 298,605 0,0208463
9 0,0833333 12,0 3440,01 3738,62 0,261001

 

       Здесь значение m получилось равным 12 (на этот период приходится самая большая ордината).

       h=n/m = 108/12=9;

       j=m/2=12/2=6;

       Воспользовавшись методом НМК, получаем следующие параметры модели и их значимость по t-статистике:

           

101,54

-7,45

а=

2,87

       

-6,03

-0,6

-3,53

-6,15

3,17

-3,72

3,8

-1,74

3,24

194,811998

значим

-10,106943

значим

tрасч =

3,893547168

значим

-8,180518962

значим

-0,813981986

незначим

-4,788927353

значим

-8,34331536

значим

4,300538161

значим

-5,046688315

значим

5,155219247

значим

-2,36054776

значим

6,216179569

значим

tрасч =

1,98498426

                           


   По t-статистике вышло, что один коэффициент вышел незначимым ( ). Проверим значимость коэффициентов по гармоникам!

Параметр

j=0

j=1

j=2

j=3

j=4

j=5

j=6

a2j-1

101,54

-7,45

-6,03

-3,53

3,17

3,8

3,24

a2j

 

2,87

-0,6

-6,15

-3,72

-1,74

 

Амплитуда ρ

 

7,98

6,06

7,09

4,89

4,18

 

Период mj=12/j

 

12,00

6,00

4,00

3,00

2,40

 

F rash (для гармоники)

58,66

33,79

46,27

21,98

16,07

 

F krit

3,09

3,09

3,09

3,09

3,09

 

Значимость

Значим

Значим

Значим

Значим

Значим

 

       По гармоникам вышло, что все коэффициенты значимы – решено было все их оставить и по ним строить прогноз.

       Итоговая модель имеет следующий вид:

       Y(t) =101,54 – 7,45cos( )+2,87sin( )-6,03cos( )-0,6sin( )-3,53cos( )-6,15sin( )+3,17cos( )-3,72sin( )+3,8cos( )-1,74sin( )+3,24cos( );

       А прогноз с прогнозными интервалами следующий:

Дата фактическое значение модельное значение остатки нижняя граница верхняя граница

янв.13

87,7

74,63

13,07

63,30

85,96

фев.13

114,9

114,61

0,29

103,28

125,94

мар.13

109,8

114,78

-4,98

103,45

126,11

апр.13

107,1

105,80

1,30

94,46

117,13

май.13

97,1

101,60

-4,50

90,27

112,93

       Выводы: Из всех модельных значений наихудшим значением оказалось за январь 2013 – фактическое значение даже не попало в границы прогнозного интервала, во всем остальном прогноз получился очень даже хорошим, особенно на февраль 2013 года (там самое маленькое отклонение получилось).

       Этап 4.Сглаживание временного ряда с использованием авторегрессионной модели. Оценка точности прогнозирования уровня показателя.

           Проверим временной ряд на стационарность при помощи расширенного теста Дикки-Фуллера. Результаты представлены ниже:

Тест Дики-Фуллера (GLS) для Y

объем выборки 111

нулевая гипотеза единичного корня: a = 1

 

с константой и трендом

модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e

коэф. автокорреляции 1-го порядка для e: 0,005

оценка для (a - 1): -0,839008

тестовая статистика: tau = -8,91146

 

                           10% 5% 2,5% 1%

Крит. значения: -2,64 -2,93 -3,18 -3,46

 

Регрессия теста Дики-Фуллера

МНК, использованы наблюдения 3-113 (T = 111)

Зависимая переменная: d_yd

           

Коэффициент Ст. ошибка t-статистика P-значение

---------------------------------------------------------------

yd_1   -0,839008 0,0941493  -8,911     NA   

 

Крит. Акаике: 3960,04 

 Крит. Шварца: 3962,75 

 Крит. Хеннана-Куинна: 3961,14

     Так как в результате получили, что | | < 1, следовательно, нулевая гипотеза о наличии единичного корняне отвергается, а, следовательно, исходный ряд стационарен относительно стохастического тренда.

Также параметр  получился отрицательным и по модулю меньше единицы. Можно сказать, что временной ряд относится к классу TSP (с детерминированным трендом).

       Исходя из всего этого d (степень интегрирования)=0;

       Теперь построим ARIMA-модели с разными параметрами, чтобы максимально уменьшить RMSE.


Models

(A) ARIMA(1,0,1)

(B) ARIMA(1,0,0) with constant

(C) ARIMA(2,0,1)

(D) ARIMA(1,1,1) with constant

(E) ARIMA(1,0,2)

Estimation Period

 

Model

RMSE

MAE

MAPE

ME

MPE

(A)

14882800,00

8916180,00

16,52

682583,00

-2,95

(B)

13496400,00

7471130,00

13,83

242,59

-4,51

(C)

14570700,00

8582170,00

15,95

268739,00

-3,80

(D)

13556000,00

7747110,00

14,62

-827903,00

-6,17

(E)

14570300,00

8559920,00

15,91

279234,00

-3,78

 

Model RMSE RUNS RUNM AUTO MEAN VAR
(A) 1,48828E7 OK OK OK OK OK
(B) 1,35577E7 OK OK OK OK OK
(C) 1,45707E7 OK OK OK OK OK
(D) 1,3556E7 OK OK OK OK OK
(E) 1,45703E7 OK OK OK OK OK

           

    Выводы: наилучшей моделью по полученным данным является модель В) - ARIMA(1,0,0) with constant: у этой модели самая низкая среднеквадратическая ошибка, самая низкая средняя ошибка прогноза, самая низкая средняя абсолютная ошибкам прогноза, средняя процентная абсолютная ошибка прогноза. Несмотря на все это, это не самая удачная модель для прогноза, потому что AR у нее не значим:

        

Parameter Estimate Stnd. Error t P-value
AR(1) 0,179737 0,0933793 1,9248 0,056814
Mean 4,96496E7 1,5448E6 32,1398 0,000000
Constant 4,07258E7      

    Зато у модели А) ARIMA(1,0,1) все параметры получились значимыми, несмотря на то, что она далеко не первая и не вторая по прогностическим характеристикам:

 

ARIMA Model Summary

Parameter Estimate Stnd. Error t P-value
AR(1) 0,998537 0,0107641 92,7651 0,000000
MA(1) 0,641288 0,0728018 8,80869 0,000000

 

Прогноз и интервал:

    Lower 95,0% Upper 95,0%
Period Forecast Limit Limit
114,0 4,95039E7 1,93673E7 7,96405E7

 

 

      

      

 

           










Последнее изменение этой страницы: 2018-04-11; просмотров: 475.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...