Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Генеральная совокупность и выборка.




Изучая психолого-педагогическое явление, в большинстве случаев мы исследуем какую-то определенную выборку людей, которая всегда отбирается из большей по численности группы. Такая объемлющая группа называется генеральной совокупностью. Генеральная совокупность – это множество элементов, объединенных общей характеристикой, указывающей на их принадлежность к определенной системе. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и той задачи, которую предстоит решать исследователю.

Выборкой (выборочной совокупностью) называется любая подгруппа элементов (испытуемых, респондентов), выделенная из генеральной совокупности для проведения эксперимента. Объем выборки, обычно обозначаемый буквой n, может быть любым, но не меньшим, чем два респондента.

Различают выборки зависимые (связные) и независимые (несвязные).

Выборки называются независимыми, если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых (респондентов) другой выборки. И напротив, выборки называются зависимыми, если процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на другую. Следует подчеркнуть, что одна и та же группа испытуемых, на которой дважды проводилось психологическое обследование (пусть даже разных психологических качеств, признаков, особенностей), по определению оказывается зависимой выборкой.

К выборке применяется ряд обязательных требований, определенных, прежде всего, целями и задачами исследования. Планирование эксперимента должно включать в себя учет как объема выборки, так и ряда ее особенностей. Так, в психологических исследованиях важно требование однородности выборки. Оно означает, что изучая, например, младших школьников, не может включать в эту же выборку взрослых людей или подростков.

Основаниями для формирования однородной выборки могут служить разные характеристики, такие, как уровень интеллекта, национальность, отсутствие определенных заболеваний и т. д., в зависимости от целей исследования.

Другое требование – выборка должна как можно более полно отражать характеристики изучаемой генеральной совокупности. Данное свойство выборки называется репрезентативностью. Репрезентативная, или представительная, выборка – это такая выборка, в которой все основные признаки генеральной совокупности представлены приблизительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всей генеральной совокупности.

Возникает закономерный вопрос, как сформировать репрезентативную выборку? С точки зрения статистики репрезентативность выборки означает, что представленное в выборке распределение изучаемых признаков соответствует (с определенной долей погрешности) их распределению в генеральной совокупности.

Распространены два метода, обеспечивающие репрезентативность выборки. Первый – метод формирования простой случайной выборки. В этом случае выборка состоит из элементов, отобранных из генеральной совокупности таким образом, чтобы каждый элемент этой совокупности имел бы равную вероятность попасть в выборку. Полученная таким образом выборка называется простой случайной выборкой. Получить простую случайную выборку можно путем обычной жеребьевки (по аналогии с лотереей) или с помощью специальных таблиц случайных чисел.

Второй метод основывается на понятии стратифицированной случайной выборки. Для этого необходимо разбить элементы генеральной совокупности на страты (группы) в соответствии с некоторыми характеристиками. Если произведена подобная разбивка совокупности и случайная выборка производится отдельно из каждой группы (страты), то полученная в итоге выборка носит название стратифицированная случайная выборка.

Как определяется объем выборки? Подчеркнем, что он зависит прежде всего от задач исследования. Педагог или психолог может изучать единичные случаи, если те по каким-либо причинам представляют особый интерес для науки. Так, например, строится работа с одаренными детьми, каждый из которых, как правило, имеет свои неповторимые особенности. Предметом отдельного исследования могут служить также редкие или уникальные случаи нарушения развития.

Когда исследователь ставит целью изучение характеристик, присущих многим представителям генеральной совокупности, возникает вопрос о наиболее приемлемом объеме выборки. В этих случаях очевидно, что больший объем выборки, позволяет получить более надежные результаты.

Кроме того, объем выборки зависит от тех статистических методов, которые предполагается использовать. Одни методы требуют большого количества испытуемых в выборке, другие могут применяться при относительно небольшом их количестве. Например, некоторые непараметрические критерии различий могут использоваться при сравнении групп численностью в 5–7 человек, а факторный анализ наиболее адекватен, если объем выборки составит около 100 человек. Для психолого-педагогических исследований желательно, чтобы численность выборки была не менее 30-35 испытуемых.

Шкалы измерения.

В психолого-педагогических исследованиях часто возникает проблема измерения индивидуально-психологических особенностей. В ходе исследования изучаемые характеристики могут получать количественное выражение. Количественные данные, полученные в результате тщательно спланированного исследования по определенным измерительным процедурам, используются затем для статистической обработки.

Измерение в самом широком смысле может быть определено как приписывание числовых форм объектам или событиям, которое осуществляется по определенным правилам.

Согласно С. Стивенсу (1951), существует четыре типа измерительных шкал (или способов измерения):

1) номинативная, номинальная, или шкала наименований;

2) порядковая, ординарная, или ранговая, шкала;

3) интервальная, или шкала равных интервалов;

4) шкала равных отношений, или шкала отношений.

Каждая измерительная шкала имеет собственную, отличную от других, форму числового представления. Поэтому признаки изучаемого явления, измеренные по одной из названных шкал, фиксируются в строго определенной числовой системе, определяемой особенностями используемой шкалы. Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, а осуществляемые с помощью двух последних шкал – количественными.

Следует помнить, что нельзя одновременно оперировать данными, измеренными в разных шкалах. Процедура оперирования числами, полученными в разных измерительных шкалах, неизбежно приведет к искажению результатов исследования, а то и просто к неправильному выводу.

Рассмотрим перечисленные шкалы.

Номинативная шкала – это шкала, классифицирующая по названию: nomen (лат.) – имя, название. Название не измеряется количественно, оно лишь позволяет отличить один объект от другого.

Номинативная шкала – это способ классификации объектов или субъектов, распределения их по ячейкам классификации. Простейший случай номинативной шкалы – дихотомическая шкала, состоящая всего лишь из двух ячеек, например: «имеет братьев и сестер – единственный ребенок в семье»; «из полной семьи – из неполной семьи»; «проголосовал "за" – проголосовал "против"» и т.п. Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два значения. При этом исследователь зачастую заинтересован в одном из них, и тогда он говорит, что признак «проявился», если тот принял интересующее его значение, и что признак «не проявился», если он принял противоположное значение.

Более сложный вариант номинативной шкалы – классификация из трех и более ячеек, например: «холерик – сангвиник – флегматик – меланхолик» или «старший – средний – младший – единственный ребенок в семье» и др. Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность подсчитать частоту встречаемости признака, т.е. число испытуемых, явлений и т.п., попавших в данный класс (группу) и обладающих данным свойством. Например, мы хотим выяснить число мальчиков и девочек в спортивной секции. Для этого мы кодируем мальчиков, например, цифрой 1, а девочек – цифрой 0. После этого подсчитываем общее количество цифр (кодов) 1 и 0. Это и есть подсчет частоты признака. Единица измерения, которой мы оперируем в случае номинативной шкалы, – это количество наблюдений (испытуемых, свойств, реакций и т. п.).

К результатам измерений, полученным в номинативной шкале, возможно применить лишь небольшое число статистических методов: например, критерий χ2 (хи-квадрат), угловое преобразование Фишера «φ».

Порядковая шкала – это шкала, классифицирующая по принципу «больше – меньше». Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки «самое малое значение» к ячейке «самое большое значение» (или наоборот). Ячейки в данном случае уместнее называть классами, поскольку по отношению к классам употребимы определения «низкий», «средний» и «высокий» класс, или 1-й, 2-й, 3-й класс и т. д.

В порядковой шкале должно быть не менее трех классов, например, «низкий уровень потребности в общении – средний уровень потребности в общении – высокий уровень потребности в общении» и т.п.

От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс – ранг 2, а высший класс – ранг 3, или наоборот. Например, необходимо закодировать уровень агрессивности по пяти градациям. Это можно осуществить следующим образом:

§ очень низкий уровень – 1;

§ низкий – 2;

§ средний – 3;

§ высокий – 4;

§ очень высокий – 5.

Чем больше классов в шкале, тем больше у нас возможностей для математической обработки полученных данных и проверки статистических гипотез.

Все психологические методы, использующие ранжирование, построены на применении порядковой шкалы. Если испытуемому предлагается упорядочить 18 ценностей по степени их значимости для него, проранжировать по степени значимости список личностных качеств педагога, то испытуемый совершает ранжирование, при котором количество рангов соответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т. п.).

К данным, полученным по порядковой шкале, применимы коэффициенты корреляции Спирмена и Кендалла, а также критерии различий.

Интервальная шкала – это шкала, классифицирующая по принципу «больше на определенное количество единиц – меньше на определенное количество единиц». Каждое из возможных значений признака отстоит от другого на равном расстоянии. Размер интервала – величина фиксированная и постоянная на всех участках шкалы. Для измерения посредством шкалы интервалов устанавливаются специальные единицы измерения; в психологии это стены и стенайны. При работе с этой шкалой измеряемому свойству или предмету присваивается число, равное количеству единиц измерения, эквивалентное количеству имеющегося свойства. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства).

В психологических методиках часто используется принцип семантического дифференциала Ч. Осгуда, что является примером измерения по интервальной шкале различных психологических особенностей личности, социальных установок, ценностных ориентации, субъективно-личностного смысла, различных аспектов самооценки и т. п.

        -3         -2       -1       0        1        2        3

абсолютно                     не знаю                          абсолютно

не согласен                                                                  согласен

 

Только измерение по строго стандартизированной тестовой методике, при условии того, что распределение значений в репрезентативной выборке достаточно близко к нормальному, может считаться измерением в интервальной шкале. Примером последнего могут служить стандартизованные тесты интеллекта, где условная единица измерения IQ эквивалента как при низких, так и при высоких значениях интеллекта.

К экспериментальным данным, полученным в этой шкале, применимо достаточно большое число статистических методов.

Статистические гипотезы.

Необходимым этапом любого исследования является предположение о том, что получится в результате эксперимента. Гипотеза представляет предположение в четком и сжатом виде. Все статистические гипотезы можно разделить на направленные и ненаправленные.

Направленная гипотеза – это предположение, касающееся степени отличий, выраженности изменений, выявленных в ходе эксперимента.

Ненаправленная гипотеза – это предположение, касающееся наличия отличий или изменений, возникающих в ходе эксперимента.

Гипотеза может быть нулевой или альтернативной.

Нулевая гипотеза – это гипотеза об отсутствии различий. Она обозначается как Н0. Если обозначить сопоставляемые значения признаков как Х1 и Х2, то при нулевой гипотезе верно равенство: Х1 – Х2 = 0. Нулевая гипотеза – это то, что опровергается, если стоит задача доказать значимость различий.

Альтернативная гипотеза – это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза – это то, что доказывается, поэтому иногда она называется экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Различия гипотез можно представить следующим образом:

Направленная нулевая гипотеза: Х1 не превышает Х2. Направленная альтернативная гипотеза: Х1 превышает Х2. Ненаправленная нулевая гипотеза: Х1 не отличается от Х2. Ненаправленная альтернативная гипотеза: Х1 отличается от Х2.

Статистические критерии.

Согласно Г.В. Суходольскому, статистический критерий – это решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой вероятностью.

Статистический критерий – это математический метод расчета числа, позволяющего определить принятие или отклонение гипотезы исследования. Критерий имеет эмпирическое и критическое значение.

Эмпирическое значение критерия – это число, полученное по правилу расчета критерия. Критическое значение критерия – это число, которое определено для данного критерия при заданных переменных (например, число человек в выборке), выделяющее зону значимости и незначимости для признака.

По соотношению эмпирического и критического значений критерия делается вывод о том, подтверждается или опровергается нулевая гипотеза. Например, если χЭМП > χкр, то Н0 отвергается.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна – Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила. Эти правила оговариваются в описании каждого из представленных критериев.

В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке, обозначаемое как n.

В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице, прилагаемой к каждому статистическому критерию, необходимо определить, какому уровню статистической значимости различий соответствует данная эмпирическая величина. В большинстве случаев, однако, одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке (n).

Зная n, по специальным таблицам определяются критические значения критерия, и полученное эмпирическое значение сопоставляется с ними, после чего делается вывод о подтверждении или опровержении гипотезы.

Критерии делятся на параметрические и непараметрические. И те, и другие имеют определенные возможности и ограничения.

Параметрические критерии – это критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (t- критерий Стьюдента, F-критерий Фишера и др.).

Параметрические критерии позволяют прямо определить различия в средних значениях и дисперсиях в двух выборках. Эти критерии позволяют выявить тенденции изменения признака при переходе от условия к условию при условии нормального распределения признака – это осуществляется в процедуре однофакторного дисперсионного анализа. С помощью данных критериев можно оценить взаимодействие двух и более факторов и их влияние на изменения признака – это осуществляется в процедуре двухфакторного дисперсионного анализа. Недостатком параметрических критериев является сложность математических подсчетов и необходимость соблюдения определенных условий:

· значения признака должны быть измерены по интервальной шкале;

· распределение признака является нормальным;

· в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.

Если эти условия соблюдены, то параметрические критерии оказываются более мощными, чем непараметрические.

Непараметрические критерии – это критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.).

Непараметрические критерии дают возможность оценить средние тенденции признака в выборках и различия в диапазонах вариативности признака. Эти критерии могут определить тенденции изменения признака при переходе от условия к условию при любом распределении признака. Но данные критерии не позволяют осуществить факторный анализ. Непараметрические критерии не требуют соблюдения равенства дисперсий, нормальности распределения признака, математические расчеты таких критериев просты и не требуют много времени.

Проверка статистических гипотез всегда связана с риском неправильного суждения из-за каких-либо случайных особенностей распределения. Для определения степени вероятности ошибочного вывода относительно статистической гипотезы вводится уровень значимости. Уровень значимости – это понятие математической статистики, величина, оценивающая риск ошибки.

Ошибка, состоящая в том, что будет отклонена нулевая гипотеза, в то время как она верна, называется ошибкой I рода. Вероятность такой ошибки обозначается как α, а вероятность правильного решения тогда будет 1 – α. Чем меньше α, тем больше вероятность правильного решения.

В психолого-педагогических исследованиях за достаточный уровень значимости принимается уровень α = 0,05, что означает: если в генеральной совокупности верна нулевая гипотеза, то результат, полученный на выборке, может повториться в 5 % случаев повторных выборок. В психологии принято считать низшим уровнем статистической значимости 5%-й уровень, который обозначается как ρ < 0,05; достаточным – 1%-й уровень (ρ < 0,01) и высшим 0,1%-й уровень (ρ < 0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости ρ < 0,05 и ρ < 0,01, иногда – ρ < 0,001.

До тех пор, однако, пока уровень статистической значимости не достигнет ρ = 0,05, мы не имеем права отклонить нулевую гипотезу. Существует определенное правило отклонения нулевой гипотезы. Если эмпирическое значение критерия равняется критическому значению, соответствующему ρ <0,05 или превышает его, то Н0 отклоняется, но мы еще не можем определенно принять H1. Если эмпирическое значение критерия равняется критическому значению, соответствующему ρ < 0,01, или превышает его, то Н0 отклоняется и принимается Н1.

Исключения: критерий знаков G, критерий Вилкоксона Т и критерий U Манна – Уитни. Для них устанавливаются обратные соотношения.

Число степеней свободы. Число степеней свободы равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся: объем выборки, средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и подсчитали количество наблюдений в каждой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании – объем выборки n.

Допустим у нас три класса: «Умеет работать на ПК – умеет выполнять лишь определенные операции – не умеет работать».

Выборка состоит из 50 человек. Если в первом классе – 20 человек, во втором классе – 20 человек, то в третьем должны оказаться 10 человек. Мы ограничены только одним условием –объемом выборки. Мы не свободны в определении количества испытуемых в третьем классе, ″свобода″ простирается только на первые два класса ν=с-1=3-1=2

Аналогичным образом, если бы у нас была классификация из 10 разрядов или классов, то мы были бы свободны только в 9 и т.д.

Зная n и/или число степеней свободы, по специальным таблицам можно определить критические значения критерия и сопоставить с ними полученное эмпирическое значение.

 










Последнее изменение этой страницы: 2018-06-01; просмотров: 413.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...