Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Выбор наиболее аппроксимируемой функции




Практическое занятие 4.

Нелинейные модели парной регрессии и корреляции

Условие: По данным проведенного опроса восьми групп семей известны данные связи расходов населения на продукты питания с уровнем доходов семьи.

Таблица 1. Исходные данные, тыс.руб. на человека

Расходы на продукты питания, y , тыс. руб. 0,9 1,2 1,8 2,2 2,6 2,9 3,3 3,8
Доходы семьи, x , тыс. руб. 1,2 3,1 5,3 7,4 9,6 11,8 14,5 18,7

Задание: исследовать функции

1) линейную у = а +bх + ε

2) полулогарифмическую у = а +b*lnх + ε

3) зависимость у = а +b√х + ε

4) степенную у = а * хb * ε

Провести сравнительный анализ моделей и выбрать ту, которая наиболее хорошо аппроксимирует исходные данные.

Ход решения

1 Исследование линейной функции у = а + bх + ε

Для удобства дальнейших вычислений составляется таблица (ε=уi-ŷ).

Таблица 2

у х х*у х2 у2 ŷх у- ŷх (у- ŷх)2 Аi %
1 0,9 1,2              
2 1,2 3,1              
3 1,8 5,3              
4 2,2 7,4              
5 2,6 9,6              
6 2,9 11,8              
7 3,3 14,5              
8 3,8 18,7              
Итого                  
Среднее значение                  
σ                  
σ2                  

 

 

 

1.1 Рассчитываются параметры линейного уравнения парной регрессии по формулами:

;   

1.2 Строится уравнение регрессии, делаются выводы об изменении расходов на питание (у) при изменении дохода семьи (х) на 1000 руб.

1.3 Определяется показатель тесноты связи – линейным коэффициентом корреляции r xy:

Делаются выводы о тесноте связи.

1.4 Определяется коэффициент детерминации r2xy

D = r2x * 100%

Делаются выводы о степени дисперсии результата(у расходов на продукты питания) под влиянием дисперсии фактора (х - доходов семьи).

1.5 Оценивается качество уравнения регрессии в целом с помощью F –критерия Фишера:

Табличное значение (k1 =1, k2 = n − 2 = 6, α = 0,05): (F табл= 5,99)

Делаются выводы о статистической значимости уравнения в целом.

1.6 Определяется средняя ошибка аппроксимации (с помощью столбца 10 таблицы 2);

Делаются выводы о качестве уравнения регрессии, т. е. о качестве подбора модели к исходным данным.

1.7 На одном графике изображаются исходные данные и линия регрессии.

 

 

2. Исследование полулогарифмической функции типа: у = а + b*lnх + ε

Для нахождения параметров регрессии делается замена: z = ln xи составляется вспомогательная таблица 3, (ε=уi-ŷ)

у х z z*у z2 у2 ŷх ε ε2 Аi %
1 0,9 1,2                
2 1,2 3,1                
3 1,8 5,3                
4 2,2 7,4                
5 2,6 9,6                
6 2,9 11,8                
7 3,3 14,5                
8 3,8 18,7                
Итого                    
Среднее значение             - -    
σ   -   - - - - - - -
σ2   -   - - - - - - -

 

2.1 Рассчитываются параметры линейного уравнения парной регрессии по формулами:

;   

2.2 Строится уравнение регрессии ŷz = а + bz. Заполняются столбцы 8-11 таблицы 3.

Индекс корреляции pxy  находится по формуле

Делаются выводы о тесноте связи.

2.3 Определяется коэффициент детерминации r2xy

D = r2x * 100%

2.4 Оценивается качество уравнения регрессии в целом с помощью F –критерия Фишера:

Табличное значение (k1 =1, k2 = n − 2 = 6, α = 0,05): (F табл= 5,99)

Делаются выводы о статистической значимости уравнения в целом.

2.5 Определяется средняя ошибка аппроксимации

Делаются выводы о качестве уравнения регрессии, т. е. о качестве подбора модели к исходным данным.

2.6 На одном графике изображаются исходные данные и линия регрессии.

3. Исследование функции с квадратным корнем типа: ŷх= a + b x

Для нахождения параметров регрессии ŷх= a + b x делается замена z = √x и составляется вспомогательная таблица 4 (ε = yi ŷ).

Таблица 4

у х z z*у z2 у2 ŷх ε ε2 Аi %
1 0,9 1,2                
2 1,2 3,1                
3 1,8 5,3                
4 2,2 7,4                
5 2,6 9,6                
6 2,9 11,8                
7 3,3 14,5                
8 3,8 18,7                
Итого                    
Среднее значение             - -    
σ   -   - - - - - - -
σ2   -   - - - - - - -

 

 

3.1 Рассчитываются параметры линейного уравнения парной регрессии по формулами:

;    

3.2 Строится уравнение регрессии ŷz = а + bz. Заполняются столбцы 8-11 таблицы 4.

3.3 Индекс корреляции pxy  находится по формуле

Делаются выводы о тесноте связи.

3.4 Определяется индекс детерминации p2xy

D = p2x * 100%

3.5 Оценивается качество уравнения регрессии в целом с помощью F –критерия Фишера:

Табличное значение (k1 =1, k2 = n − 2 = 6, α = 0,05): (F табл= 5,99)

Делаются выводы о статистической значимости уравнения в целом.

3.6 Определяется средняя ошибка аппроксимации

Делаются выводы о качестве уравнения регрессии, т. е. о качестве подбора модели к исходным данным.

3.7 На одном графике изображаются исходные данные и линия регрессии.

4. Исследование степенной функции типа: ŷ = a * bx

4.1 Для нахождения параметров регрессии ŷ = a * bx *⋅ε необходимо провести ее линеаризацию: Y = A + b ⋅ X + Ε,

где Y = ln y, X = ln x, A = ln a, Ε = lnε .

Составляется вспомогательная таблица 5 для преобразованных данных:

Таблица 5

У Х Х*У Х2 У2 ŷх ε ε2 Аi %
1                  
2                  
И т.д                  
8                  
Итого                  
Среднее значение                  
σ                  
σ2                  

 

4.2 Находится уравнение регрессии:

После потенцирования находится искомое уравнение регрессии. Заполняются столбцы 7–10 таблицы.

4.3 Индекс корреляции pxy  находится по формуле

Делаются выводы о тесноте связи.

4.4 Определяется индекс детерминации p2xy

D = p2x * 100%

4.5 Оценивается качество уравнения регрессии в целом с помощью F –критерия Фишера:

Табличное значение (k1 =1, k2 = n − 2 = 6, α = 0,05): (F табл= 5,99)

Делаются выводы о статистической значимости уравнения в целом.

4.6 Определяется средняя ошибка аппроксимации

Делаются выводы о качестве уравнения регрессии, т. е. о качестве подбора модели к исходным данным.

4.7 На одном графике изображаются исходные данные и линия регрессии.

Выбор наиболее аппроксимируемой функции

Сравниваются построенные модели по индексу детерминации и средней ошибке аппроксимации:

 

Таблица 6

Модель Индекс (коэффициент) детерминации Средняя ошибка аппроксимации
1) линейная у = а + bх + ε    
2) полулогарифмическая  у = а +b*lnх + ε    
3) модель с квадратным корнем  у = а +b√х + ε    
4) степенная у = а * хb * ε    

 

Выводы.










Последнее изменение этой страницы: 2018-04-12; просмотров: 245.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...