Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Таким образом, коэффициент корреляции показывает близость связи между двумя СВ к линейной.
Сила корреляционной связи в зависимости от значения коэффициента корреляции rxy:
Оценка коэффициента корреляции случайных величин на основе экспериментальных данных
Пусть x i {\displaystyle x_{i}}Xi и Yi– i-й элемент выборки СВ X и Y соответственно; n {\displaystyle n} – объём выборки. Оценка коэффициента корреляции определяется формулой:
2. Парная корреляция между набором величин. Корреляционная матрица
Для представления коэффициента корреляции нескольких случайных величин А, В, С, D и т.д. удобно использовать корреляционную таблицу:
Замечания: 1. На главной диагонали корреляционной матрицы стоят 1, rAA=rВВ= rСС=... =1 так как, по сути, это коэффициент корреляции между двумя линейно связанными величинами с коэффициентом пропорциональности 1. 2. Коэффициент корреляции не меняется от перестановки порядка переменных, т.е. rAB = rBA, таким образом, корреляционная таблица симметрична относительно главной диагонали, и ее нижнюю часть можно не заполнять. 3. Оценка точности регрессионной модели Рассмотрим линейную парную корреляционную модель вида: y=b0+b1x. (1) Параметры модели b0 и b1 определяются с помощью метода наименьших квадратов на основе экспериментальных данных: < (i), y(i)>, (2) где i=1, 2,... N, как это было рассмотрено ранее. Требуется оценить как близко экспериментальные точки (2) лежат возле прямой (1). Как известно близость к связи к жесткой линейной показывает коэффициент корреляции, который для линейной зависимости принимает значения +1 или -1. Для решения задачи используется коэффициент детерминации, который принимает значения от 0 до +1 и численно равен квадрату коэффициента корреляции: R2=rxy2. Если связь жесткая линейная и все экспериментальные точки (2) лежат на прямой (1) коэффициент детерминации R2=1. 4. Корреляционный анализ в электронных таблицах Корреляционный анализ в MS Excel:
1. Нахождение коэффициента корреляции Коэффициент корреляции: =КОРРЕЛ(диапазон 1;диапазон 2)
2. Расчет корреляционной матрицы средствами MS Excel
Функция Корреляция надстройки Анализ данных. Меню данной функции имеет вид:
Необходимо ввести:
1. Диапазон клеток, в котором находятся входные данные для определения корреляции. 2. Выбрать, как сгруппированы векторы, между которыми ищется корреляция - по столбцам или строка. 3. Обозначит, являются ли первые строки (столбцы - в зависимости от способа группирования) выбранных данных заголовками (метками). 4. Место для вывода результатов.
Корреляционный анализ в LibreOffice Calc
1. Нахождение коэффициента корреляции Коэффициент корреляции: =KORREL(диапазон 1;диапазон 2)
2. Расчет корреляционной матрицы: Данные - Статистика - Корреляция
ГЛАВА 5. ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ Имитационное моделирование (метод Монте-Карло) – метод моделирования, позволяющий учесть неопределенность вероятностного характера в данных или параметрах и состоящий в генерации соответствующих случайных чисел, проведении необходимых вычислений со случайными числами и статистической оценки результата. Один из возможных вариантов постановки задачи: необходимо оценить значение некоторой переменной Q, которая зависит от ряда параметров a1, a2, ... an: . Точные значения параметров a1, a2, ... an не известны, а лишь заданы их законы распределения. В частности, для переменной Q нужно найти оценку закона распределения, а также определить вероятности, что она принимает значения больше некоторого заданного числа, меньше заданного числа, а также лежит в заданном диапазоне. Для пояснения рассмотрим следующий пример: пусть на протяжении трех лет будет реализован инвестиционный проект, точное значение прибыли по годам не известно, но можно предположить, что за первый год она будет лежать в диапазоне от 0 до 1 млрд. руб., за второй год - от 1 млрд. руб. до 2 млрд. руб. и за третий год - от 2 млрд. руб. до 3 млрд. руб. Необходимо построить закон распределения суммарной прибыли за три года, а также оценить вероятность, что суммарная прибыль превысит 5 млрд. руб. Рассмотрим решение задачи с помощью табличного процессора MS EXCEL. В столбцах А, В и С сгенерируем случайные числа имитирующие прибыль за первый, второй и третий годы соответственно. Для этого воспользуемся надстройкой "Анализ данных" - "Генерация случайных чисел". На рисунке показана генерация случайных чисел для столбов А, В и С соответственно. Отметим, что в каждом из столбцов генерируется по 1000 случайных чисел.
В столбце D поместим суммарную прибыль, которую определим как сумму случайных чисел из первых трех столбцов.
Воспользовавшись автозаполнением рассчитаем суммарную прибыль для всех 1000 вариантов. Вероятность, что суммарная прибыль превысит 5 млрд. руб. можно оценить следующим образом: подсчитать число вариантов, в которых суммарная прибыль превысила 5 млрд. руб. – m и поделить это число на общее число вариантов N=1000, т.е. p=m/N= m/1000. Для подсчета m воспользуемся функцией "СЧЁТЕСЛИ".
Далее несложно определить, что искомая вероятность приблизительно составляет 0,18.
Построим гистограмму суммарной прибыли (см. файл алгоритм построения гистограммы), с помощью которой наглядно изображаются оценки вероятностей попадания случайной величины на тот или иной интервал.
Отметим, что оценить вероятность, что суммарная прибыль превысит 5 млрд. руб. можно и с помощью гистограммы, для этого необходимо просуммировать число попаданий в карманы больше 5 и поделить на общее число случайных чисел: (99+62+17+1)/1000 ~ 0,18. Замечание. В рассматриваемом примере число испытаний выбрано равным 1000. Следует отметить, что чем больше число испытаний, тем выше точность имитационного моделирования, в тоже время при этом растет объем вычислений. Рекомендуется брать число испытаний не менее 1000, а еще лучше не менее 10 000.
|
||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2018-04-12; просмотров: 214. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |