Студопедия

КАТЕГОРИИ:

Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Таким образом, коэффициент корреляции показывает близость связи между двумя СВ к линейной.

⇐ ПредыдущаяСтр 3 из 5Следующая ⇒

Сила корреляционной связи в зависимости от значения коэффициента корреляции r_xy:

сильная: ±0,7 до ±1
средняя: ±0,3 до ±0,699
слабая: 0 до ±0,299

Оценка коэффициента корреляции случайных величин на основе

экспериментальных данных

Пусть x i {\displaystyle x_{i}}X_i иY_i– i-й элемент выборки СВ X и Y соответственно; n {\displaystyle n} – объём выборки.

Оценка коэффициента корреляции определяется формулой:

2. Парная корреляция между набором величин. Корреляционная матрица

Для представления коэффициента корреляции нескольких случайных величин А, В, С, D и т.д. удобно использовать корреляционную таблицу:

	А	В	С	D	...
A	r_AA=1	r_AB	r_AC	r_AD	...
B		r_ВВ=1	r_BC	r_BD	...
C			r_СС=1	r_CD	...
D				r_DD=1	...
...	...	...	...	...	...

Замечания:

1. На главной диагонали корреляционной матрицы стоят 1, r_AA=r_ВВ= r_СС=... =1 так как, по сути, это коэффициент корреляции между двумя линейно связанными величинами с коэффициентом пропорциональности 1.

2. Коэффициент корреляции не меняется от перестановки порядка переменных, т.е. r_AB = r_BA, таким образом, корреляционная таблица симметрична относительно главной диагонали, и ее нижнюю часть можно не заполнять.

3. Оценка точности регрессионной модели

Рассмотрим линейную парную корреляционную модель вида:

y=b₀+b₁x. (1)

Параметры модели b₀ и b₁определяются с помощью метода наименьших квадратов на основе экспериментальных данных:

< _(i), y_(i)>, (2)

где i=1, 2,... N,

как это было рассмотрено ранее.

Требуется оценить как близко экспериментальные точки (2) лежат возле прямой (1).

Как известно близость к связи к жесткой линейной показывает коэффициент корреляции, который для линейной зависимости принимает значения +1 или -1.

Для решения задачи используется коэффициент детерминации, который принимает значения от 0 до +1 и численно равен квадрату коэффициента корреляции:

R²=r_xy².

Если связь жесткая линейная и все экспериментальные точки (2) лежат на прямой (1) коэффициент детерминации R²=1.

4. Корреляционный анализ в электронных таблицах

Корреляционный анализ в MS Excel:

1. Нахождение коэффициента корреляции

Коэффициент корреляции: =КОРРЕЛ(диапазон 1;диапазон 2)

2. Расчет корреляционной матрицы средствами MS Excel

Функция Корреляция надстройки Анализ данных.

Меню данной функции имеет вид:

Необходимо ввести:

1. Диапазон клеток, в котором находятся входные данные для определения корреляции.

2. Выбрать, как сгруппированы векторы, между которыми ищется корреляция - по столбцам или строка.

3. Обозначит, являются ли первые строки (столбцы - в зависимости от способа группирования) выбранных данных заголовками (метками).

4. Место для вывода результатов.

Корреляционный анализ в LibreOffice Calc

1. Нахождение коэффициента корреляции

Коэффициент корреляции: =KORREL(диапазон 1;диапазон 2)

2. Расчет корреляционной матрицы:

Данные - Статистика - Корреляция

ГЛАВА 5. ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ

Имитационное моделирование (метод Монте-Карло) – метод моделирования, позволяющий учесть неопределенность вероятностного характера в данных или параметрах и состоящий в генерации соответствующих случайных чисел, проведении необходимых вычислений со случайными числами и статистической оценки результата.

Один из возможных вариантов постановки задачи: необходимо оценить значение некоторой переменной Q, которая зависит от ряда параметров a₁, a₂, ... a_n: . Точные значения параметров a₁, a₂, ... a_n не известны, а лишь заданы их законы распределения. В частности, для переменной Q нужно найти оценку закона распределения, а также определить вероятности, что она принимает значения больше некоторого заданного числа, меньше заданного числа, а также лежит в заданном диапазоне.

Для пояснения рассмотрим следующий пример: пусть на протяжении трех лет будет реализован инвестиционный проект, точное значение прибыли по годам не известно, но можно предположить, что за первый год она будет лежать в диапазоне от 0 до 1 млрд. руб., за второй год - от 1 млрд. руб. до 2 млрд. руб. и за третий год - от 2 млрд. руб. до 3 млрд. руб.

Необходимо построить закон распределения суммарной прибыли за три года, а также оценить вероятность, что суммарная прибыль превысит 5 млрд. руб.

Рассмотрим решение задачи с помощью табличного процессора MS EXCEL.

В столбцах А, В и С сгенерируем случайные числа имитирующие прибыль за первый, второй и третий годы соответственно. Для этого воспользуемся надстройкой "Анализ данных" - "Генерация случайных чисел".

На рисунке показана генерация случайных чисел для столбов А, В и С соответственно.

Отметим, что в каждом из столбцов генерируется по 1000 случайных чисел.

В столбце D поместим суммарную прибыль, которую определим как сумму случайных чисел из первых трех столбцов.

Воспользовавшись автозаполнением рассчитаем суммарную прибыль для всех 1000 вариантов.

Вероятность, что суммарная прибыль превысит 5 млрд. руб. можно оценить следующим образом: подсчитать число вариантов, в которых суммарная прибыль превысила 5 млрд. руб. – m и поделить это число на общее число вариантов N=1000, т.е. p=m/N= m/1000.

Для подсчета m воспользуемся функцией "СЧЁТЕСЛИ".

Далее несложно определить, что искомая вероятность приблизительно составляет 0,18.

Построим гистограмму суммарной прибыли (см. файл алгоритм построения гистограммы), с помощью которой наглядно изображаются оценки вероятностей попадания случайной величины на тот или иной интервал.

Отметим, что оценить вероятность, что суммарная прибыль превысит 5 млрд. руб. можно и с помощью гистограммы, для этого необходимо просуммировать число попаданий в карманы больше 5 и поделить на общее число случайных чисел: (99+62+17+1)/1000 ~ 0,18.

Замечание. В рассматриваемом примере число испытаний выбрано равным 1000. Следует отметить, что чем больше число испытаний, тем выше точность имитационного моделирования, в тоже время при этом растет объем вычислений. Рекомендуется брать число испытаний не менее 1000, а еще лучше не менее 10 000.

⇐ Предыдущая 1 234 5 Следующая ⇒

Последнее изменение этой страницы: 2018-04-12; просмотров: 214.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...