Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Оценка достоверности отличий.
Одной из наиболее часто встречающихся задач при обработке данных является оценка достоверности отличий между двумя или более рядами значений. В математической статистике существует ряд способов для этого. Степень выявленного различия желательно оценивать, опираясь на содержательные критерии. Вместе с тем, для психологического исследования весьма характерно наличие множества показателей, которые, по существу, являются условными баллами, и валидность оценивания с их помощью еще предстоит доказать. Чтобы избежать большей произвольности, в таких случаях также приходится опираться на статистические параметры. Пожалуй, наиболее распространено для этого использование сигмы. Разницу между двумя значениями в одну сигму и более можно считать достаточно выраженной. Если сигма подсчитана для ряда значений более 35, то достаточно выраженной можно рассматривать и разницу в 0.5 сигмы. Однако, для ответственных выводов о том, насколько велика разница между значениями, лучше использовать строгие критерии. При использовании в качестве измерительных интервальных щкал достоверность различий средних арифметических можно оценить по достаточно эффективному параметрическому критерию Стьюдента (t). Он вычисляется по формуле: где: M1 и M2 – значения сравниваемых средних арифметических, m1 и m2 – соответствующие величины статистических ошибок средних арифметических. Значения критерия Стьюдента для трех уровней значимости (p) приведены в Приложении № . Число степеней свободы определяется по формуле:d = n1 + n2 – 2, где n1 и n2 – объемы сравниваемых выборок. С уменьшением объемов выборок (n < 10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуется использовать непараметрические методы или сравнивать полученные значения с критическими (приведенными в таблице) для более высокого уровня значимости. Решение о достоверности различий принимается в том случае, если вычисленная величина td превышает табличное значение для данного числа степеней свободы. В тексте публикации или научного отчета указывают наиболее высокий уровень значимости из трех: 0.05, 0.01 или 0.001. Если превышены 0.05 и 0.01, то пишут (обычно в скобках) р = 0.01 или р < 0.01. Это означает, что оцениваемые различия все же случайны только с вероятностью не более 1 из 100 шансов. Если превышены табличные значения для всех трех уровней: 0.05, 0.01 или 0.001, то указывают р = 0.001 или р < 0.001, что означает случайность выявленных различий между средними не более 1 из 1000 шансов. Следует помнить, что при любом численном значении критерия достоверности различий между средними этот показатель оценивает не степень выявленного различия (она оценивается по самой разности между средними), а лишь статистическую достоверность его, т.е. право распространять полученный на основе сопоставления выборок вывод о наличии разницы на все явления (весь процесс) в целом. Низкий вычисленный критерий различия не может служить доказательством отсутствия различия между двумя признаками (явлениями) ибо его значимость (степень вероятности) зависит не только от величины средних, но и от численности сравниваемых выборок. Он говорит не об отсутствии различия, а о том, что при данной величине выборок оно статистически недостоверно: слишком велик шанс, что разница при данных условиях определения случайна, слишком мала вероятность его достоверности. Для порядковых и номинальных шкал применяются непараметрические критерии, с помощью которых сравниваются не обобщающие показатели выборок (в случае с интервальными шкалами в качестве таковых выступают параметры распределения), а сопоставляются распределения частот. Непараметрические критерии можно применять и для интервальных данных, т.к. эти критерии не требуют анализа формы распределения, т.е. не рассчитаны только на нормальное распределение (подобно критерию Стьюдента и Фишера). Наконец, применение их предпочтительно с точки зрения простоты математического аппарата. Критерий χ2 («хи-квадрат») Пирсона используется для сравнения частот двух распределений: двух эмпирических или эмпирического и теоретического. Формула критерия χ2 такова: ƒт - теоретическая (ожидаемая) частота. При сопоставлении двух эмпирических выборок равного объёма вычисления упрощаются, если формулу χ2 преобразовать таким образом: Полученные величины критерия сравниваются с табличными значениями для того или иного уровня значимости (Табл. Приложения 1). Критерий λ - Колмогорова-Смирнова используется для сравнения двух рядов накопленных частот и рассчитывается по формуле:
где Cumƒi’ и Cumƒi’’ – накопленные к i–му разряду частоты. Многофункциональные критерии (Сидоренко Е.В., 1996, гл. 5) используются по отношению к самым разнообразным признакам, выборкам и задачам. Они построены на сопоставлении долей, выраженных в долях единицы или в процентах. Суть их состоит в определении того, какая доля наблюдений (реакций, выборов, испытуемых и т.п.) в данной выборке характеризуется интересующим исследователя эффектов и какая доля этим эффектом не характеризуется. Биномиальный критерий m применяется в том случае, когда обследована лишь одна выборка испытуемых объёмом не более 300 (в некоторых задачах – не более 50) единиц. Он позволяет оценить, насколько эмпирическая частота (m) наблюдений, в которых проявляется интересующий нас эффект, превышает теоретическую, среднестатистическую или какую-то заданную частоту. Порядок его применения прост: эмпирическая частота m сравнивается с критическим значением mкр, найденным с помощью Таблицы №__ (Приложение 1). Если m равен или превышает mкр, то различия достоверны. Критерий φ* Фишера (угловое преобразование Фишера) предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта. Суть его состоит в переводе процентных долей d в величины центрального угла φ, измеряемого в радианах (Таблица №__, Приложение 1). Эмпирическое значение (φ*) подсчитывается по формуле: где φ1 – угол, соответствующий большей % доле; φ2 - угол, соответствующий меньшей % доле; n1 – количество наблюдений в выборке 1; n2 – количество наблюдений в выборке 2. По таблицам Приложения 1 либо определяем, какому уровню значимости соответствует φ* (Таблица №.__), либо сравниваем с критическими значениями φ*, соответствующим уровням значимости, принятым в психологии: φ*0.05 = 1,64; φ*0.01 = 2,31.
|
||||||||||||||
Последнее изменение этой страницы: 2018-04-12; просмотров: 281. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |