Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Пример определения линейной регрессии




Основы корреляционного и регрессионного анализа.

Корреляция — статистическая взаимосвязь двух или более случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми).

Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными.

Ограничения корреляционного анализа:

1) Применение возможно при наличии достаточного количества наблюдений для изучения. На практике считается, что число наблюдений должно не менее чем в 5­6 раз превышать число факторов.

2) Необходимо, чтобы совокупность значений всех факторных и результативного признаков подчинялась многомерному нормальному распределению.

3) Исходная совокупность значений должна быть качественно однородной.

4) Сам по себе факт корреляционной зависимости не даёт основания утверждать, что одна из переменных предшествует или является причиной изменений, или то, что переменные вообще причинно связаны между собой, а не наблюдается действие третьего фактора.

Регрессия– зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин.

Регрессионный анализ – раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по данным статистических наблюдений.

Задача корреляционного анализа– определение тесноты и направления связи между изучаемыми величинами.

В ходе регрессионного анализаопределяется аналитическое выражение связи зависимой случайной величины Y (результативный признак) с независимыми случайными величинами Х1, Х2, …Хm (факторами).

Практически речь идёт о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности точно отражающую заключённую в этом множестве закономерность, тенденцию – линию регрессии.

Уравнение регрессии- это форма связи результативного признака Y с факторами Х1, Х2, …Хm. В зависимости от типа выбранного уравнения различают линейную и нелинейную (квадратичную, экспоненциальную, логарифмическую и т.д.) регрессию.

В зависимости от числа взаимосвязанных признаков различают парную и множественную регрессию.

Парная – исследуется связь между двумя признаками (результативным и факторным).

Множественная (многофакторная) – между тремя признаками (результативным и несколькими факторными).

Последовательность этапов регрессионного анализа

1) Формулировка задачи. На этом этапе формируются предварительные гипотезы о зависимости исследуемых явлений.

2) Определение зависимых и независимых (объясняющих) переменных.

3) Сбор статистических данных. Данные должны быть собраны для каждой из переменных, включенных в регрессионную модель.

4) Формулировка гипотезы о форме связи (парная или множественная, линейная или нелинейная).

5) Определение функции регрессии (заключается в расчете численных значений параметров уравнения регрессии)

6) Оценка точности регрессионного анализа.

7) Интерпретация полученных результатов. Полученные результаты регрессионного анализа сравниваются с предварительными гипотезами. Оценивается корректность и правдоподобие полученных результатов.

8) Предсказание неизвестных значений зависимой переменной

Линейные и нелинейные регрессии.

 

Рисунок 1 – Линейная регрессия

Рисунок 2 – Нелинейная регрессия

 

 



Линейная регрессия

При моделировании технологических процессов во многих случаях связь между входными (x) и выходными (y) параметрами можно аппроксимировать линейным полиномом (зависимостью)

 

Для получения вида математической модели необходимо определить коэффициенты уравнения регрессии b0 и b1. Для этого применяется метод наименьших квадратов.

 

 



Пример определения линейной регрессии

  Xi Yi Xi2 XiYi Yi-Yср (Yi-Yср)2 Функция

Значе-ния

1 30          
2 7          
3 8          
4 1          
Сумма 10 46          

Нелинейная регрессия

· линейной (у = а + bx);

· параболической (y = a + bx + cx2);

· экспоненциальной (y = a * exp(bx));

· степенной (y = a*x^b);

· гиперболической (y = b/x + a);

· логарифмической (y = b * 1n(x) + a);

· показательной (y = a * b^x).

 Реализация регрессионного анализа.

Уравнение множественной линейной регрессии


где – теоретические значения результативного признака, полученные путем подстановки соответствующих значений факторных признаков в уравнение регрессии;

– значения факторных признаков;

 – параметры уравнения (коэффициенты регрессии).

 

Рисунок - Линия линейной регрессии с изображенными остатками (вертикальные пунктирные линии) для каждой точки.

Рассмотрим на примере построение регрессионной модели в Excel и интерпретацию результатов. Возьмем линейный тип регрессии.

Задача. На 6 предприятиях была проанализирована среднемесячная заработная плата и количество уволившихся сотрудников. Необходимо определить зависимость числа уволившихся сотрудников от средней зарплаты.

Модель линейной регрессии имеет следующий вид:

У = а0 + а1х1 +…+акхк.

Где а – коэффициенты регрессии, х – влияющие переменные, к – число факторов.

В нашем примере в качестве У выступает показатель уволившихся работников. Влияющий фактор – заработная плата (х).

В Excel существуют встроенные функции, с помощью которых можно рассчитать параметры модели линейной регрессии. Но быстрее это сделает надстройка «Пакет анализа».

Активируем мощный аналитический инструмент:

1. Нажимаем кнопку «Офис» и переходим на вкладку «Параметры Excel». «Надстройки».

2. Внизу, под выпадающим списком, в поле «Управление» будет надпись «Надстройки Excel» (если ее нет, нажмите на флажок справа и выберите). И кнопка «Перейти». Жмем.

3. Открывается список доступных надстроек. Выбираем «Пакет анализа» и нажимаем ОК.

 

После активации надстройка будет доступна на вкладке «Данные».

Теперь займемся непосредственно регрессионным анализом.

1. Открываем меню инструмента «Анализ данных». Выбираем «Регрессия».

2.Откроется меню для выбора входных значений и параметров вывода (где отобразить результат). В полях для исходных данных указываем диапазон описываемого параметра (У) и влияющего на него фактора (Х). Остальное можно и не заполнять.

3. После нажатия ОК, программа отобразит расчеты на новом листе (можно выбрать интервал для отображения на текущем листе или назначить вывод в новую книгу).

 

В первую очередь обращаем внимание на R-квадрат и коэффициенты.

R-квадрат – коэффициент детерминации. В нашем примере – 0,755, или 75,5%. Это означает, что расчетные параметры модели на 75,5% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «неплохо».

Коэффициент 64,1428 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.

Коэффициент -0,16285 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.


Список использованной литературы

1. C.А. Айвазян, В.С. Мхитарян «Теория вероятностей и прикладная статистика»: Учеб. пособие. М., 2001.

2. Е.С. Кочетков «Теория вероятностей и математическая статистика»: Учеб.пособие. М., 2001.

3. В.А. Фигурин «Теория вероятности и математическая статистика»: Учеб.пособие. – Мн. ООО «Новое знание», 2000.

4. В.Е. Гмурман «Теория вероятностей и математическая статистика». Учеб.пособие. М.: высшее образование, 2006.

          АО «МЕДИЦИНСКИЙ УНИВЕРСИТЕТ АСТАНА»      Кафедра информационных технологий и коммуникации в здравоохранении, включая биостатистику           РЕФЕРАТ     Тема: НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ                                                           Выполнила: Раимбекова А.А                                                         Группы: К-126                                   Астана 2018г                    
          АО «МЕДИЦИНСКИЙ УНИВЕРСИТЕТ АСТАНА»      Кафедра информационных технологий и коммуникации в здравоохранении, включая биостатистику           РЕФЕРАТ     Тема: НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ                                                           Выполнила: Раимбекова А.А                                                         Группы: К-126                                   Астана 2018г                    
          АО «МЕДИЦИНСКИЙ УНИВЕРСИТЕТ АСТАНА»      Кафедра информационных технологий и коммуникации в здравоохранении, включая биостатистику           РЕФЕРАТ     Тема: НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ                                                           Выполнила: Раимбекова А.А                                                         Группы: К-126                                   Астана 2018г                    
          АО «МЕДИЦИНСКИЙ УНИВЕРСИТЕТ АСТАНА»      Кафедра информационных технологий и коммуникации в здравоохранении, включая биостатистику           РЕФЕРАТ     Тема: НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ                                                           Выполнила: Раимбекова А.А                                                         Группы: К-126                                   Астана 2018г                    
АО «МЕДИЦИНСКИЙ УНИВЕРСИТЕТ АСТАНА» Кафедра информационных технологий и коммуникации в здравоохранении, включая биостатистику     РЕФЕРАТ         Тема: Корреляционный и регрессионный анализа.                                                         Выполнила: Раимбекова А.А                                                         Группы: К-126   Проверила: Султанова Ж.Д                           Астана 2018г                    










Последнее изменение этой страницы: 2018-05-10; просмотров: 251.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...