Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Экспериментально-статистическое исследование связей




Главная задача всякого научного исследования заключается в изучении связей между явлениями, параметрами и факторами. Связи бы­вают функциональными и вероятностными (статистическими). В первом случае каждому значению входной величины соответствует одно или не­сколько строго определенных значений выходной. Статистические свя­зи проявляются лишь при многократном испытании. При этом данному значению входной ве­личины соответствует множество значений выходной.

Корреляционный анализ

Корреляционный анализ — один из широко распространенных методов оценки статистических связей. Он отвечает на вопросы: влияет ли дан­ная входная величина на выходную и какова степень (теснота) связи между величинами?

Предположим, что в результате эксперимента, цель которого — изучить влияние фактора x на параметр y, получены данные в виде совокупностей значений х и y, объемом n каждая, причем каждому значению xі соответствует определенное значение yi.

Каждую пару величин можно представить точкой на поле коорди­нат xОy. Совокупность точек образует диаграмму рассеивания, рис. 7.1. По такой диа­грам­ме можно судить о тесноте свя­зи между величинами, однако подобная оценка субъективна.

Числовой характеристикой связи служит корреляция — математическое ожидание произведения отклонений x и y от их математических ожиданий:

                                ,                                 (7.1)

Оценка корреляции по опытным данным:

                                 .                                 (7.2)

Размерность полученной величины равна произведению размерностей величин x и y, что затрудняет анализ тесноты связи. Поэтому чаще используют безразмерный коэффициент корреляции, равный

                                    ,                                    (7.3)

или для результатов опыта оценку коэффициента корреляции:

                             .                             (7.4)


Коэффициент корреляции является оценкой степени связи между величинами и изменяется в диапазоне [–1;+1].

Выясним, как связано значение коэффициента корреляции с видом диаграммы рассеяния. Рассмотрим такие случаи:

1) Точки рассеяны в некоторой области, симметричной относительно вертикальной и горизонтальной прямых с уравнениями  и , рис. 7.1 а. Эти прямые делят плоскость xОy на четыре квадранта. Произведение  в I и III квадрантах будет иметь знак (+), а во II и IV — знак (–).

Поскольку точки рассеяны таким образом, что количество точек в каждом квадранте приблизительно одинаково, сумма (7.4) будет близка к нулю: . Это говорит о том, что, по-видимому, связь между величинами x и y отсутствует.

2) Между величинами x и y существует функциональная линейная зависи­мость вида

                                             ,

где b и b0 — коэффициенты, рис. 7.1 б, в. Тогда  и . Подставив последнее выражение в (7.4), получим

                      .

Поскольку согласно (6.22) Sy = |b| Sx, .

Положительному значению b соответствует kxy = 1, рис. 7.1 б, а отрица­тель­ному — kxy = –1, рис. 7.1 в. Следовательно, если по результатам опытов получено значение kxy = ±1, можем утверждать, что между величинами x и y существует функциональная линейная зависи­мость.

3) Точки рассеяны в некоторой области, расположенной несимметрично относительно прямых с уравнениями  и . Например, на рис. 7.1 г в I и III квадрантах точек значительно больше, чем во II и IV. Следовательно, в сумме (7.4) будут преобладать положительные произведения и значение коэффициента корреляции будет находиться в интервале 0 < kxy < 1. В случае, представленном на рис. 7.1 д, в сумме преобладают отрицательные значения и
–1 < kxy < 0.

Оба эти случая свидетельствуют о наличии статистической связи между величинами x и y.

Возможны случаи, когда между величинами существует статистическая или даже функциональная связь, но в некотором интервале значений этих величин их коэффициент корреляции будет близок к нулю. Например, между величинами x и y на рис. 7.1 е существует явная функциональная связь, но , поскольку область, в которой распределены точки, симметрична относительно .

Таким образом, коэффициент корреляции дает оценку не только наличия связи между величинами, но и степени ее линейности.


Регрессионный анализ

Целью регрессионного анализа является установление аналитиче­ской зависимости между выходной и входными величинами по данным экспери­ментальных исследований.

Известно, что в общем случае зависимость между величинами может быть представлена таблично, графически и аналитически. Табличный способ позволяет определить значение выходной величины для заданных значений входных, но не дает представления о характере зависимости. Графический способ создает наглядность представле­ния зависимости, позволяет визуально оценить ее характер. Аналитическая зависимость позволяет исследовать функ­цию методами математического анализа, т.е. определить значения максимума, миниму­ма, точек перегиба и т.д. Получение аналитической зависимости желательно при разработке расчетных методик, в особенности при создании расчетных программ на ЭВМ. Эта зависимость наиболее универсальна, из нее просто получить табличную и графическую.

Аналитические зависимости, полученные по данным эксперимента путем регрессионного анализа называются эмпирическими или аппроксимирую­щими. Необходимо иметь в виду, что если теоретические формулы, полу­ченные на основе знания законов процесса, могут быть использованы при произвольных значениях аргументов, то эмпирические являются приближенными и могут применяться лишь в определенных условиях и в ограниченных пределах аргументов. Один и тот же процесс может быть описан нескольки­ми различными эмпирическими форму­лами.

В регрессионном анализе в отличие от корреляционного только вы­ход­ные величины являются случайными. Входные должны быть неслучай­ными и некоррелированными между собой.

Задача получения аналитической зависимости включает в себя три этапа:

— выбор вида уравнения регрессии;

— определение коэффициентов урав­нения;

— проверка адекват­ности установленной зависимости данным экспери­мен­та.

Первый этап является неформализованной процедурой. Здесь многое зависит от опыта исследователя. Уже отмечалось, что один и тот же процесс может быть описан различными эмпирическими зависимостями. На практике при выборе вида уравнения обычно руководствуются следующим. По данным эксперимента первоначально строят графическую зависимость. Ее сравнивают с различными кривыми, уравнения которых известны, и останавливаются на наиболее вероятной.


При выборе формулы нет необходимости ориентироваться на сложные зависимости. Ценность формулы определяется не сложностью, а той погреш­ностью, которая допускается при ее применении. На рис. 7.2 а точками пред­ставлены данные эксперимента. Для аппроксимации этих данных может быть использована как линейная (линия 1), так и некоторая более сложная зависи­мость (линия 2). Последняя более точно аппроксимирует данные эксперимента, что видно из графика, но ее практическое использование может быть затруднено из-за громоздкости формулы и сложности ее вычисления. Поэтому предпочтение следует отдавать простым, в первую очередь линейным уравне­ниям, и только в случае явно нелинейной зависимости, рис. 7.2 б — выбирать другие: квадратичные, степенные и т.п.

Если в результате построений окажется, что некоторые точки су­щест­венно отклоняются от общей зависимости, то следует проверить вы­числения для них, а при необходимости повторить эксперимент.

Если до обработки эксперимен­тальных данных известна теория исследу­емого процесса, в основу эмпирической зависимости желательно положить функциональную зависимость, определяемую этой теорией. Например, известно, что теоретическая напорная характеристика турбомашины является прямой линией, а потери напора в турбомашине пропорциональны квад­рату расхода. Поэтому для описания экспе­риментальной напорной характеристики наиболее целесообразна ориен­тация на квадратичные зависимости.

После выбора вида зависимости определяют коэффициенты, входящие в эту зависимость. В общем виде задачу можно сформулировать следующим образом.

Исследуется зависимость параметра y от факторов x1, x2, …, xk. Проведено n серий опытов при различных сочетаниях уровней факторов; в каждой серии для u-го сочетания уровней факторов получена выборка значений параметра y, определено среднее выборочное  и дисперсия . Для поиска аппроксима­ционной зависимости выбрана некоторая функция вида

                                       ,                                       (7.5)

которая содержит m неизвестных параметров (коэффициентов, показателей степеней и др.) b1, b2, …, bm. Задача состоит в определении такого сочетания этих параметров, при котором значения y, рассчитанные по зависи­мости (7.5), будут наиболее близки к экспериментальным данным .

В настоящее время выполнение такой задачи не представляет трудности, поскольку существуют программы для ЭВМ, предназначенные для поиска аппроксимационых зависимостей и определения их коэффициентов.

Наиболее распространенным методом поиска коэффициентов уравнений регрессии является метод наименьших квадратов. Метод заключается в поиске минимума функции

                             ,                              (7.6)

где  — значение параметра y, полученное расчетом по зависимости (7.5) для u-го сочетания уровней факторов. Функция (7.6) характеризует степень расхож­дения расчетных значений и опытных данных. Наилучшим будет такое сочета­ние коэффициентов, при котором это расхождение будет мини­маль­ным. Следовательно, задача сводится к поиску минимума функции Ф и может быть решена методом математического анализа.

Рассмотрим случай поиска линейной однофакторной зависимости вида

                                             ,                                             (7.7)

для совокупности экспериментальных данных, представленной на рис. 7.2 а.

Функция Ф в данном случае есть функция двух переменных:

                      .                      (7.6)

Функция будет иметь минимум, если ее частные производные по обоим переменным будут равны нулю

                             ;

                           .

Преобразовав выражения, получим систему двух линейных уравнений

                                                    (7.7)

Решив систему, найдем значения коэффициентов уравнения регрессии.

В практике математической обработки опытных данных широко ис­пользуются нелинейные формулы, достаточно просто преобразуемые к линейному виду. К ним относятся параболические и степенные зависимости.

Распространенная в гидравлическом эксперимен­те параболическая зависимость вида  приводится к линейному виду подстановкой z = x2. Коэффициенты полученного линейного уравнения  находят­ся по описанной методике.

Степенные зависимости вида

                                       ,                                       (7.8)

где C — коэффициент, b1, b2, …, bk — показатели степени, приводятся к полиномиальному виду путем логарифмирования:

               ,                (7.8)

Обозначив b0 = Ln C — свободный член полинома, и прологарифмировав значения факторов и параметра, можем применить метод наименьших квадратов для поиска значений b0, b1, b2, …, bk.

Проверка соответствия установленной зависимости эксперименталь­ному материалу (проверка адекватности) включает в себя три этапа.

1. Ищется остаточная дисперсия, или дисперсия адекват­но­сти

                                   ,                                    (7.6)

где fад = n – m — количество степеней свободы, равное разности количества опытов n и количества коэффициентов в уравнении регрессии m.

Дисперсия адекватности будет тем меньше, чем лучше совпадают расчет­ные значения параметра  с экспериментальными данными .

2. Определяется дисперсия воспроизводимости, показывающая точность определения параметра в опыте.

В случае, если для каждого сочетания уровней факторов проводилось нес­коль­ко параллельных опытов, ищутся дисперсии  для каждой группы опытов, проверяется их одно­родность и затем определяется средневзвешенная дисперсия  по зависимости (6.39), которая и принимается в качестве диспер­сии воспроизводимости .

Если параллельные опыты не проводятся, то в качестве средне­взвешенной дисперсии принимается

                                          ,                                          (7.6)

где ΔYпред — предельная абсолютная погрешность определения выходной величины, определяемая по классу прибора и с доверительной вероятностью 0,955 равная двум среднеквадратическим отклонениям измеряемой величины.

3. Проверяется однородность дисперсий адекватности и воспроизводи­мости

                                 ,                                  (7.1)

где  — количество степеней свободы дисперсии воспроиз­во­димо­сти; nп u — количество параллельных опытов для u-го сочетания уровней факторов.

Если расчетное значение критерия Фишера окажется меньше таблич­ного, то полученное уравнение регрессии адекватно эксперименту с уровнем значи­мости α.










Последнее изменение этой страницы: 2018-04-12; просмотров: 509.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...