Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Похибки оцінок параметрів значно збільшуються, відповідно збільшуються їхні інтервали довіри.




Адже стандартні похибки оцінок параметрів моделі обчислюються як корінь квадратний із дисперсій цих оцінок. Раніше ми показали, що дисперсії оцінок параметрів моделі значно збільшуються, а отже, стандартні та граничні похибки також збільшуються.

Якщо = 0,90, то похибка збільшиться в

Номер цеху Продуктивність праці, Фондомісткість, млн грн. Коефіцієнт плинності робочої сили, %
1 32 0,89 19,5
2 29 0,43 15,6
3 30 0,70 13,5
4 31 0,61 9,5
5 25 0,51 23,5
6 34 0,51 12,5
7 29 0,65 17,5
8 24 0,43 14,5
9 20 0,51 14,5
10 33 0,92 7,5

.

Це означає, що інтервал довіри за наявності мультиколінеарності буде в 2,29 разу більший, ніж тоді, коли її немає.

3. Оцінки параметрів моделі можуть бути статистично незначущими.Статистична незначущість оцінок параметрів моделі може виявлятись на фоні високого рівня довіри до моделі в цілому. Це пояснюється не тим, що досліджувані пояснювальні змінні мають слабкий зв’язок із залежною, а наявністю їхнього взаємозв’язку.

Нагадаємо, що для оцінювання статистичної значущості оцінок параметрів моделі застосовуються t-критерії, в яких абсолют­не значення оцінки порівнюється з її похибкою. Оскільки в разі мультиколінеарності похибки значно збільшуються і збільшується також їхня кореляція, то t-критерії прямуватимуть до нуля. Трапляються випадки, коли існує мультиколінеарність, але економетрична модель в цілому є достовірною, статистично значущими є всі оцінки параметрів моделі. Тоді мультиколінеарність не є проблемою. У цих випадках оцінки параметрів мають такі числові значення, які попри збільшення стандартних похибок залишаються набагато більшими і, відповідно, статистично значущими. На мультиколінеарність можна не зважати і тоді, коли мета економетричного моделювання — лише прогнозування. Чим вище R2, тим точніший прогноз, але ця закономірність справджується лише доти, доки залежні змінні, що прогнозуються, мають однакову майже лінійну залежність з початковою матрицею пояснювальних змінних X.

З огляду на перелічені наслідки мультиколінеарності при побудові економетричної моделі потрібно мати інформацію про те, що між пояснювальними змінними не існує мультиколінеарності.

6.3. Ознаки мультиколінеарності

Коли серед парних коефіцієнтів кореляції пояснювальних змінних є такі, рівень яких наближається або дорівнює множинному коефіцієнту кореляції, то це означає можливість існування мультиколінеарності. Інформацію про парну кореляцію може дати симетрична матриця коефіцієнтів парної кореляції між пояснювальними змінними:

                                                 .                                                                             (6.6)

Проте коли до моделі входять більш як дві пояснювальні змінні, то вивчення питання про мультиколінеарність не може обмежуватись інформацією, що її дає ця матриця. Явище мультиколінеарності в жодному разі не зводиться лише до існування пар­ної кореляції між пояснювальними змінними.

Більш загальна перевірка передбачає знаходження визначника (детермінанта) матриці rxx, який є детермінантом кореляції і позначається . Числові значення детермінанта кореляції задовіль­няють умову: .

Якщо , то існує повна мультиколінеарність, а коли = 1, мультиколінеарність відсутня. чим ближче  до нуля, тим певніше можна стверджувати, що між пояснювальними змінними існує мультиколінеарність. Незважаючи на те, що на числове значення  впливає дисперсія пояснювальних змінних, цей показник можна вважати точковою мірою рівня мультиколінеарності.

Коли коефіцієнт частинної детермінації , який обчислено для регресійних залежностей між k-юпояснювальною змінною та рештою, має значення, близьке до одиниці, то можна говорити про наявність мультиколінеарності.

Якщо в економетричній моделі знайдено мале значення оцінки параметра  за високого рівня частинного коефіцієнта детермінації  і водночас F-критерій істотно відрізняється від нуля, то це також може свідчити про наявність мультиколінеарності.

Якщо під час побудови економетричної моделі на основі покрокової регресії введення нової пояснювальної змінної істотно змінює оцінку параметрів моделі за незначного підвищення (або зниження) коефіцієнтів кореляції чи детермінації, то ця змінна перебуває, очевидно, у лінійній залежності від інших, що їх було введено до моделі раніше.

Усі ці ознаки мультиколінеарності мають один спільний недолік: ні одна з них чітко не розмежовує випадки, коли залежність між пояснювальними змінними істотна і коли нею можна знехтувати.

 

6.4. Алгоритм Фаррара—Глобера

Найповніше дослідити мультиколінеарність можна застосувавши алгоритм Фаррара—Глобера. Цей алгоритм має три види статистичних критеріїв, згідно з якими перевіряється мультиколінеарність усього масиву пояснювальних змінних (  — «хі»-квадрат); кожної пояснювальної змінної з рештою змінних (F-критерій); кожної пари пояснювальних змінних (t-критерій).

Усі ці критерії при порівнянні з їхніми критичними значеннями дають змогу робити конкретні висновки щодо наявності чи відсутності мультиколінеарності пояснювальних змінних.

Опишемо алгоритм Фаррара—Глобера.

Крок 1. Нормалізація змінних.

Позначимо вектори пояснювальних змінних економетричної моделі через . Елементи нормалізованих векторів обчислимо за формулами:

                                                 1) ; 2) ,                                                                              (6.7)

де  — кількість спостережень ;  — кількість пояснювальних змінних ;  — середнє арифметичне k-ї пояснювальної змінної;  — дисперсія k-ї пояснювальної змінної.

Крок 2. Знаходження кореляційної матриці згідно з двома методами нормалізації змінних:

1) ; 2) ,                                                                                                                                                    (6.8)

де — матриця нормалізованих незалежних (пояснювальних) змінних, — матриця, транспонована до матриці .

Крок 3. Визначення критерію  («хі»-квадрат):

                                                       ,                                                                                 (6.9)

де  — визначник кореляційної матриці rxx.

Значення цього критерію порівнюється з табличним при  ступенях свободи і рівні значущості . Якщо , то в масиві пояснювальних змінних існує мультиколінеарність.

Крок 4. Визначення оберненої матриці:

                                                                       .                                                                                        (6.10)

Крок 5. Обчислення F-критеріїв:

                                                                       ,                                                                                              (6.11)

де  — діагональні елементи матриці C. Фактичні значення критеріїв порівнюються з табличними при m – 1 і n – m ступенях свободи і рівні значущості a. Якщо Fk факт > Fтабл, то відповідна k-та пояснювальна змінна мультиколінеарна з іншими.

Коефіцієнт детермінації для кожної змінної

. (6.12)

Якщо коефіцієнт детермінації наближається до одиниці, то пояснювальна змінна мультиколінеарна з іншими.

Крок 6. Знаходження частинних коефіцієнтів кореляції:

                                                                                (6.13)

де  — елемент матриці C, що міститься в k-му рядку і j-му стовпці;  i  — діагональні елементи матриці C.

Крок 7. Обчислення t-критеріїв:

                                                                               . (6.14)

Фактичні значення критеріїв  порівнюються з табличними при  ступенях свободи і рівні значущості . Якщо tkj > tтабл, то між пояснювальними змінними  і  існує мультиколінеарність.

Розглянемо застосування алгоритму Фаррара—Глобера до розв’язування конкретної задачі.

Приклад 6.1. На середньомісячну заробітну плату впливає ряд чинників. Вирізнимо серед них продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили. Щоб побудувати економетричну модель заробітної плати від згаданих чинників згідно з методом найменших квадратів, потрібно переконатися, що продуктивність праці, фондомісткість та коефіцієнт плинності робочої сили як незалежні змінні моделі — не мультиколеніарні.

Вихідні дані наведені в табл. 6.1.

Таблиця 6.1

Дослідити наведені чинники на наявність мультиколеніарністі.

Розв’язання.

Крок 1. Нормалізація змінних.

Позначимо вектори незалежних змінних — продуктивності праці, фондомісткості, коефіцієнтів плинності робочої сили — через . Елементи стандартизованих векторів обчислимо за формулою:

де n — кількість спостережень, n = 10; m — число незалежних змінних, m = 3;  — середнє арифметичне значення вектора ;  — дисперсія змінної .

Із формули бачимо, що спочатку потрібно обчислити середні арифметичні для кожної пояснювальної змінної:

Усі розрахункові дані для стандартизації змінних  згідно з поданими співвідношеннями наведено в табл. 6.2.

Таблиця 6.2

Дисперсії кожної незалежної змінної мають такі значення:

Тоді знаменник для стандартизації кожної незалежної змінної буде такий:

:                                    

:                                

:                                

Матриця стандартизованих змінних подається у вигляді:

.

Крок 2. Знаходження кореляційної матриці:

де — матриця, транспонована до  .

Ця матриця симетрична і має розмір 3 × 3.

Для даної задачі

Кожний елемент цієї матриці характеризує тісноту зв’язку однієї незалежної змінної з іншою. Оскільки діагональні елементи характеризують тісноту зв’язку кожної незалежної з цією самою змінною, то вони дорівнюють одиниці. Зауважимо, що при знаходженні добутку матриць  за рахунок зміщеності коефіцієнтів парної кореляції числові значення діагональних елементів можуть наближатись до одиниці. Якщо це так, то вони заміняються одиницями, а інші значення матриці r збільшуються на величину, що визначається як різниця між одиницею і діагональним елементом.

Інші елементи матриці r дорівнюють:

тобто вони є парними коефіцієнтами кореляції між пояснювальними змінними. Користуючись цими коефіцієнтами, можна зробити висновок, що між змінними  існує зв’язок. Але чи можна стверджувати, що цей зв’язок є виявленням мультиколінеарності, а через це негативно впливатиме на оцінку економетричної моделі?

Щоб відповісти на це запитання, потрібно ще раз звернутися до алгоритму Фаррара — Глобера і знайти статистичні критерії оцінки мультиколінеарності.

Крок 3. Обчислимо детермінант кореляційної матриці r і критерій :

а)

б)

При ступені свободи  і рівні значущості = 0,01 критерій табл = 11,34. оскільки факт < табл, доходимо висновку, що в масиві змінних не існує мультиколінеарності.

Крок 4. Знайдемо матрицю, обернену до матриці r:

Крок 5. Використовуючи діагональні елементи матриці C,обчислимо F-критерії:

Для рівня значущості  = 0,05 і ступенів свободи = 7 і = 2 критичне (табличне) значення критерію F = 4,74.

Оскільки

F1факт < Fтабл;

F2факт < Fтабл;

F3факт < Fтабл,

то ні одна з незалежних змінних не мультиколінеарна з двома іншими.

Щоб визначити наявність попарної мультиколінеарності, продовжимо дослідження і перейдемо до кроку 6.

Ї

Крок 6. Обчислимо частинні коефіцієнти кореляції, скориставшись елементами матриці C:

Частинні коефіцієнти кореляції характеризують тісноту зв’язку між двома змінними за умови, що третя не впливає на цей зв’язок.

Порівнявши частинні коефіцієнти кореляції з парними, які було наведено раніше, можна помітити, що частинні коефіцієнти значно менші за парні. Це ще раз показує, що на підставі парних коефіцієнтів кореляції не можна зробити висновків про наявність мультиколінеарності чи її відсутність.

Крок 7. Визначимо t-критерій на основі частинних коефіцієнтів кореляції.

Табличне значення t-критерію при = 7 ступенях свободи і рівні значущості a = 0,05 дорівнює 1,69. Усі числові значення t-критеріїв, знайдених для кожної пари змінних, менші за їх табличні значення. Звідси робимо висновок, що всі пари незалежних змінних не є мультиколінеарними.

Отже, незважаючи на те, що між пояснювальними змінними досліджуваної моделі існує лінійна залежність, це не мультиколінеарність, тобто негативного впливу на кількісні оцінки параметрів економетричної моделі, не буде.

Якщо F-критерій більший за табличне значення, тобто коли k-та змінна залежить від усіх інших у масиві, то необхідно вирішувати питання про її вилучення з переліку змінних.

Якщо  — критерій більший за табличний, то ці дві змінні (  і ) тісно пов’язані одною з одною. Звідси, аналізуючи рівень обох видів критеріїв  і , можна зробити обгрунтований висновок про те, яку зі змінних необхідно вилучити з дослідження або замінити іншою. Проте заміна масиву незалежних змінних завжди має узгоджуватись з економічною доцільністю, що випливає з мети дослідження.

Найпростіше позбутися мультиколінеарності в економетричній моделі можна, відкинувши одну зі змінних мультиколінеарної пари. Але на практиці вилучення якогось чинника часто суперечить логіці економічних зв’язків. Тоді можна перетворити певним чином пояснювальні змінні моделі:

а) взяти відхилення від середньої;

б) замість абсолютних значень взяти відносні;

в) стандартизувати пояснювальні змінні

і т. iн.

За наявності мультиколінеарності змінних потрібно звертати увагу й на специфікацію моделі. Іноді заміна однієї функції іншою, якщо це не суперечить апріорній інформації, дає змогу уникнути явища мультиколінеарності.

Коли жодний з розглянутих способів не дає змоги позбутися мультиколінеарності, то параметри моделі слід оцінювати за методом головних компонентів.

 

üПриклад 6.2.(ЛАБ)На основі даних про чинники, що впливають на прибуток (табл. 6.3), дослідити їх на наявність мультиколінеарності за допомогою алгоритму Фаррара—Глобера, що містить три статистичні критерії:

ü c2;

ü F-критерій;

ü t-критерій.

Прибуток, гр. од. Інвестиції, гр. од. ОВФ, гр. од. ФРЧ, людино-днів
(у) (x1) (х2) (хЗ)
39 62 22 104
41 65 25 109
38 57 17 99
42 66 27 114
44 69 28 116
49 58 20 110
44 72 32 119
45 70 30 116
48 75 34 114
51 79 35 120
49 77 33 124
54 82 37 119
55 80 37 129
57 75 39 129
56 83 38 132
54 81 36 130
59 87 40 124
61 92 42 134
62 95 43 137
64 97 42 139

Розв’язання. Дослідимо наявність мультиколінеарності, виконавши такі кроки:

1. Нормалізацію (стандартизацію) пояснювальних змінних мо­делі.

2. Розрахунок кореляційної матриці rxx.

3. Визначення детермінанта матриці rxx.

4. Визначення критерію c2.

5. Розрахунок матриці, оберненої до матриці rxx.

6. Визначення F-критерію.

7. Обчислення частинних коефіцієнтів кореляції.

8. Визначення t-критерію.

1. Нормалізація (стандартизація) пояснювальних змінних моделі.

Обчислимо середні арифметичні пояснювальних змінних:

, .

Визначимо стандартні відхилення:

, .

Нормалізуємо залежну та пояснювальні змінні:

; ;

2. Розрахунок кореляційної матриці нульового порядку.

,

де X* — матриця нормалізованих пояснювальних змінних;

 — матриця, транспонована до X*.

Маємо:

.

Парні коефіцієнти кореляції характеризують тісноту зв’язку між двома змінними. Вони можуть змінюватися в межах від – 1 до 1. У нашому випадку:

r12 = 0,953; r13 = 0,912; r23 = 0,924.

Ці коефіцієнти парної кореляції близькі до одиниці, тому можна передбачити, що всі досліджувані пояснювальні змінні є мультиколінеарними.

3. Визначення детермінанта матриці rxx:

det r = 0,012257.

Детермінант матриці rxx є точковою мірою мультиколінеарності, в нашому випадку він наближається до 0 (0,012257), а отже, мультиколінеарність існує.

4. Визначення критерію c2:

,

де n — кількість спостережень; m — кількість пояснювальних змінних.

Виконавши обчислення, дістанемо:

; ; при .

Фактично обчислене значення критерію c2 порівнюємо з табличним за вибраного рівня значущості a і даних ступенів свободи: .

Доходимо висновку, що

> .

Отже,  більше за , а це означає, що в масиві пояснювальних змінних існує мультиколінеарний зв’язок, саме це і простежується в нашому випадку.

5. Розрахунок матриці, оберненої до матриці rхх:

;

.

Матриця с — симетрична, і її діагональні елементи завжди мають бути додатними.

6. Визначення F-критерію:

; ;

; ; ;

F1 = 92,43606;  F2 = 107,3519;   F3 = 54,5759;

Fкрит. = 19,43704.

Коли a = 0,05 і ступені свободи m – 1 = 2; n – m = 17, маємо Fкрит = 19,44.

Фактично знайдене значення F-критерію порівнюємо з таб-
личним.

У нашому випадку Fфакт > Fкрит, тобто пояснювальні змінні мультиколінеарні з рештою змінних.

7. Обчислення частинних коефіцієнтів кореляції:

;

; ; .

r12.3 = 0,704215; r13.2 = 0.272309; r23.1 = 0,439721.

Частинні коефіцієнти кореляції характеризують рівень тісноти зв’язку між двома змінними за умови, що решта змінних на цей зв’язок не впливає. Частинні коефіцієнти кореляції за модулем нижчі, ніж коефіцієнти парної кореляції, бо на їхній рівень не впливає решта змінних, які мають зв’язок із цими двома.

8. Визначення t-критерію:

;

tk1= 8,430911; tk2= 2,40553; tk3= 4,161543;

tкрит = 2,109819.

Обчислені t-критерії порівнюємо з табличним за вибраного рівня значущості a= 0,05 і ступенів свободи nm = 17. Якщо tkj більше за tтабл, як у нашому випадку, то пара цих пояснювальних змінних тісно пов’язана між собою. Оскільки всі розраховані t-критерії більше від критичного, то між всіма пояснювальними змінними існує мультиколінеарність. А це означає, що метод найменших квадратів застосувати в цьому разі не можна.

 

 


ГЕТЕРОСКЕДАСТИЧНІСТЬ

Припущення, які було зроблено під час оцінювання параметрів моделі 1МНК, на практиці можуть порушуватися.

У розд. 6 було розглянуто проблему мультиколінеарності, яка пов’язана з порушенням четвертої умови.

Рік Заощадження Дохід Рік Заощадження Дохід
1 0,36 8,8 10 0,59 15,5
2 0,2 9,4 11 0,90 16,7
3 0,08 10,0 12 0,95 17,7
4 0,20 10,6 13 0,82 18,6
5 0,10 11,0 14 1,04 19,7
6 0,12 11,9 15 1,53 21,1
7 0,41 12,7 16 1,94 22,8
8 0,50 13,5 17 1,75 23,9
9 0,43 14,3 18 1,99 25,2

Тепер розглянемо особливості економетричного моделювання, коли порушується умова (4.3), згідно з якою припускається, що відхилення мають такий розподіл імовірностей, який зберігається для всіх спостережень. Тоді дисперсія залишків лишається незмінною для кожного спостереження.

Означення 7.1.Якщо дисперсія залишків стала для кожного спостереження, тобто , то ця її властивість називається гомоскедастичністю.

Часто у практичних дослідженнях явище гомоскедастичності залишків порушується. Наприклад, будуючи економетричну модель, що характеризує залежність між заощадженнями і доходами населення на підставі теоретичної та практичної інформації, можна висунути гіпотезу, що дисперсія залишків за окремими групами населення змінюватиметься і буде пропорційною до середнього доходу цієї групи. Коли розглядати економетричну модель, що характеризує залежність між депозитними вкладами і розміром прибутку клієнтів банку або між витратами на харчування і доходом на одного члена сім’ї, витратами на харчування і загальними витратами, то також можна припустити, що дисперсія залишків для окремих груп спостережень змінюватиметься. У цих залежностях пояснювальна змінна може різко змінюватись, а динаміка залежної змінної буде досить помірною, не адекватною до зміни пояснювальної змінної. Це і приводить до зміни дисперсії залишків кожного спостереження або ж груп спостережень.Означення 7.2.Якщо дисперсія залишків змінюється для
кожного спостереження або групи спостережень, тобто , то це явище називається гетероскедастичністю.

7.2. Наслідки гетероскедастичності

За наявності гетероскедастичності оцінки параметрів, отримані 1МНК, як правило, залишаються незміщеними, обґрунтованими, але неефективними.

Нагадаємо, що дисперсія оцінок параметрів простої лінійної моделі визначається так:

;                  (7.1)

                                                             .                                                                                               (7.2)

Рік Рік
1 0,041 0,114 10 0,038 0,065
2 0,022 0,106 11 0,054 0,060
3 0,008 0,100 12 0,054 0,056
4 0,019 0,094 13 0,044 0,054
5 0,009 0,091 14 0,053 0,051
6 0,010 0,084 15 0,073 0,047
7 0,032 0,079 16 0,085 0,044
8 0,037 0,074 17 0,073 0,042
9 0,030 0,070 18 0,079 0,040

У цих співвідношеннях дисперсія залишків є сталою, тому вона винесена за знак суми. За гетероскедастичності дисперсія  буде змінюватись через зростаючий розкид значень залишків, тобто вона зростатиме. Це означає, що буде зростати дисперсія оцінок параметрів моделі, яка приводить до збільшення їхніх стандартних похибок.

Дисперсія оцінки  у разі гетероскедастичності запишеться так:

                                                                   .                                                                       (7.3)

Порівнюючи обидва співвідношення дисперсій оцінок , бачимо, що , тобто дисперсія оцінки параметра  за гетероскедастичності більша, ніж дисперсія цієї оцінки за гомоскедастичності.

Звідси інтервали довіри оцінок параметрів моделі також будуть більшими. Як наслідок, F та t-критерії дають неточні результати.

Таким чином, якщо не звертати увагу на гетероскедастичність і використовувати звичайні процедури перевірки гіпотез, то висновки будуть неправильними, тобто потенційно гетероскедастичність є серйозною проблемою.

Пояснимо сутність побудови моделі 1МНК за наявності гетероскедастичності.

Припустимо, що дисперсія залишків змінюється пропорційно до величини , де xij i-те значення j-ї пояснювальної змінної, яка може викликати гетероскедастичність.

Тоді, щоб усунути гетероскедастичність, можна перетворити вихідну інформацію, поділивши кожну зі змінних на xij і до цієї інформації застосувати 1МНК.

Економетрична модель матиме вигляд:

                                                                                                    (7.4)

У результаті для оцінювання параметрів можна застосувати 1МНК. Зауважимо, що параметри а0 і а1 помінялися ролями. Віль­ним членом моделі замість а0 стала оцінка параметра а1.

üПриклад 7.1. побудуємо економетричну модель, що характеризує залежність між заощадженнями та доходом населення, млрд ф. ст. (табл. 7.1).

Таблиця 7.1

Скориставшись оператором оцінювання 1МНК

дістанемо  = –1,081;  = 0,1178.

Економетрична модель має такий вигляд:

Коефіцієнт детермінації  для цієї моделі = 0,918, а це означає, що варіація заощаджень Y на 91,8 % визначається варіацією доходів населення.

На перший погляд, результат наводить на думку, що специфікація моделі не містить похибки.

Але логічно висунути гіпотезу, що відхилення заощаджень можуть бути пропорційними до доходу, тобто для цієї моделі досить ймовірне існування гетероскедастичності залишків.

Отже, вихідну інформацію перетворимо, поділивши обидві змінні на дохід X (табл. 7.2):

 

Нове рівняння зв’язку згідно з даними табл. 7.2 має такий вигляд:

У результаті перетворення вихідних даних практично повністю змінилася специфікація моделі. Оскільки , то цей зв’язок нелінійний. По-друге,  характеризує відносний показник — рівень заощаджень, який припадає на одиницю доходу.

Виконавши цю процедуру, дістанемо таке: спостереження з меншими значеннями  мають відносно більшу питому вагу при оцінюванні параметрів моделі, ніж у першому варіанті.

З наведеного прикладу бачимо, що явище гетероскедастичності не впливатиме на оцінки параметрів 1МНК, якщо певним чином перетворити вихідну інформацію. Згідно з цим, якщо економетрична модель має лише дві змінні, то це можна зробити так, як у прикладі 7.1.

Це перетворення значно ускладнюється, якщо будується економетрична модель з багатьма змінними. У такому разі потрібно з’ясувати зміст гіпотези, згідно з якою , де  лишається невідомим параметром, а  — відома симетрична додат­но визначена матриця.

7.3. Методи визначення
гетероскедастичності

7.3.1. Перевірка гетероскедастичності за крите-
рієм
m. Цей метод застосовується тоді, коли вихідна сукупність спостережень досить велика. Розглянемо відповідний алгоритм.

Крок 1. Вихідні дані залежної змінної Y розбиваються на k груп  відповідно до зміни рівня величини Y.

Крок 2. Закожною групою даних обчислюється сума квадратів відхилень:

Крок 3. Визначається сума квадратів відхилень у цілому по всій сукупності спостережень:

Крок 4. Обчислюється параметр :

де n — загальна сукупність спостережень; nrкількість спостережень r-ї групи.

Крок 5. Обчислюється критерій:

 (7.5)

який наближено відповідатиме розподілу  при ступені свободи , коли дисперсія всіх спостережень однорідна. Тобто якщо значення  не менше за табличне значення  за вибраного рівня довіри і ступені свободи  то спостерігається гетероскедастичність.

група I група II група III
0,36 0,41 0,82
0,20 0,50 1,04
0,08 0,43 1,53
0,20 0,59 1,94
0,10 0,90 1,75
0,12 0,95 1,99

üПриклад 7.2. Для даних, які наведено у прикладі 7.1, перевіримо наявність гетероскедастичності згідно з критерієм m.

Розв’язання

Крок 1. Розіб’ємо дані залежної змінної, які наведені в таблиці 7.1, на три групи, по шість спостережень у кожній.

 

Крок 2. Обчислимо суму квадратів відхилень індивідуальних значень кожної групи від свого середнього значення:

2.1.

2.2. ;                                                                               ;

.

Крок 3. Знайдемо суму квадратів відхилень за всіма трьома групами:

= S1 + S2 + S3 = 0,05313 + + 0,2822 + 1,1703 = 1,5056 .

Крок 4. Обчислимо параметр

Крок 5. Знайдемо критерій

Цей критерій наближено задовольняє розподіл c2 з k – 1 = 2 ступенями свободи. Порівняємо значення критерію m з табличним значенням критерію c2 з k – 1 = 2 ступенями свободи за рівня довіри 0,99,  = 9,21. Оскільки m > , то дисперсія залишків буде змінюватись, тобто для даних табл. 7.1 спостерігається гетероскедастичність.

7.3.2. Параметричний тест Гольдфельда—Квандта. У випадку, коли сукупність спостережень невелика, розглянутий вище метод застосовувати недоцільно.

У такому разі Гольдфельд і Квандт запропонували розглянути випадок, коли , тобто дисперсія залишків зростає пропорційно до квадрата однієї з незалежних змінних моделі:

Y = XA + u.

Для виявлення наявності гетероскедастичності згадані вчені склали параметричний тест, в якому потрібно виконати такі кроки.

Крок 1. Упорядкувати спостереження відповідно до величини елементів вектора Xj.

Крок 2. Відкинути c спостережень, які містяться в центрі вектора. Ця процедура дасть змогу порівняти дисперсії залишків для найменших та найбільших значень пояснювальної змінної. Згідно з експериментальними розрахунками автори знайшли оптимальні співвідношення між параметрами c і n для 30—60 спостережень, де n — кількість елементів вектора :

.

Крок 3. Побудувати дві економетричні моделі на основі 1МНК за двома утвореними сукупностями спостережень обсягом ,  за умови, що обсяг  і  перевищує кількість змінних m. Якщо  то відкидається перше або останнє спостереження сукупності.

Крок 4. Знайти суму квадратів залишків за першою (1) і другою (2) моделями  і :

,

де  — залишки за моделлю (1);

,

де  — залишки за моделлю (2).

Крок 5. Обчислити критерій

, (7.6)

який у разі виконання гіпотези про гомоскедастичність відповідатиме F-розподілу з ,  ступенями свободи. Це означає, що обчислене значення R* порівнюється з табличним значенням F-критерію для ступенів свободи  і  і вибраним рівнем значущості a. Якщо , то гетероскедастичність відсутня.

üПриклад 7.3. У табл. 7.3 наведено дані про загальні витрати та витрати на харчування сімей. Для цих даних перевірити гіпотезу про наявність гетероскедастичності.

Витрати   Загальні витрати, u u2
2,30 15 2,16 0,14 0,020
2,20 15 2,16 0,04 0,002
2,08 16 2,20 –0,12 0,015
2,20 17 2,25 –0,05 0,002
2,10 17 2,25 –0,15 0,022
2,32 18 2,29 0,26 0,0007
2,45 19 2,34 0,11 0,012
2,50 20      
2,20 20      
2,50 22      
3,10 64      
2,50 68 2,37 0,13 0,016
2,82 72 2,52 0,29 0,085
3,04 80 2,68 0,36 0,128
2,70 85 2,99 –0,29 0,084
3,94 90 3,18 0,76 0,573
3,10 95 3,38 –0,28 0,076
3,99 100 3,57 0,42 0,178

Розв’язання.

1. Ідентифікуємо змінні:

Y — вектор витрат на харчування, залежна змінна;

X — вектор загальних витрат, незалежна змінна.

Y = f (X, u).

2. Для перевірки гіпотези про наявність гетероскедастичності застосуємо параметричний тест Гольдфельда—Квандта.

2.1. Упорядкуємо значення незалежної змінної від меншого до більшого і відкинемо c значень, які містяться всередині впорядкованого ряду:

, c »4.

У результаті матимемо дві сукупності спостережень:

                     

2.2. Побудуємо дві економетричні моделі на основі двох новостворених сукупностей спостережень.

2.3. Визначимо залишки за цими двома моделями:

;                                                  .

Залишки та квадрати залишків наведено в табл. 7.3.

2.4. Обчислимо дисперсії залишків та знайдемо їх співвідношення:

.

2.5. Порівняємо критерій  з критичним значенням F-критерію при g1= 5 і g2= 5 ступенях свободи і значущості a = 0,01 F(a= 0,01) = 11. Оскільки > , то вихідні дані з імовірністю 0,99 мають гетероскедастичність.

 

7.3.4. Тест Глейзера. Ще один тест для перевірки гетероскедастичності запропонував Глейзер. Він розглядає регресію модуля залишків , що відповідають регресії найменших квадратів, як певну функцію від , де  — та незалежна змінна, яка відповідає зміні дисперсії . Для цього використовуються такі види функцій:

1) ;2) ;

3) 4) .

У цих рівняннях  — стохастична складова.

Рішення про відсутність гетероскедастичності залишків приймається на підставі статистичної значущості коефіцієнтів  і  Переваги цього тесту визначаються можливістю розрізняти випадок чистої і мішаної гетероскедастичності.

Можливі чотири випадки:

1)  є статистично значущими;

2) — статистично значуща, — статистично незначуща оцінка;

3) — статистично значуща, — статистично незначуща оцінка;

4) — статистично незначущі.

У першому випадку залишки гетероскедастичні, причому існує чиста і мішана гетероскедастичність. У другому випадку залишки мають мішану гетероскедастичність. Третій випадок свідчить про наявність чистої гетероскедастичності. У четвертому випадку гетероскедастичність відсутня.

 

 

Місяць Y u u2  
1 2,36 2,00 0,36 0,1296  
2 2,20 2,06 0,14 0,0196  
3 2,08 2,13 –0,05 0,0025  
4 2,20 2,19 0,01 0,0001  
5 2,10 2,24 –0,14 0,0196  
6 2,12 2,34 –0,22 0,0484  

 

 

üПриклад 7.4. Нехай потрібно перевірити наявність гетероскедастичності для побудови економетричної моделі, яка описуватиме залежність між рівнем заощаджень і доходом. Вихідні дані наведено в табл. 7.4.

 

üПриклад 7.4. Нехай потрібно перевірити наявність гетероскедастичності для побудови економетричної моделі, яка описуватиме залежність між рівнем заощаджень і доходом. Вихідні дані наведено в табл. 7.4.

Місяць Дохід, гр. од. Заощадження, гр. од. Місяць Дохід, гр. од. Заощадження, гр. од.
1 10,8 2,36 10 17,5 2,59
2 11,4 2,20 11 18,7 2,90
3 12,0 2,08 12 19,7 2,95
4 12,6 2,20 13 20,6 2,82
5 13,0 2,10 14 21,7 3,04
6 13,9 2,12 15 23,1 3,53
7 14,7 2,41 16 24,8 3,44
8 15,5 2,50 17 25,9 3,75
9 16,3 2,43 18 27,2 3,99

Таблиця 7.4










Последнее изменение этой страницы: 2018-04-12; просмотров: 230.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...