Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

В СОЦИОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ




Социологи изучают поведение (мнения, оценки, мотивы) не отдельно взятых людей, но некоторых человеческих "совокупно­стей" - социальных групп, классов, сообществ. Информация о мас­совых социальных явлениях и процессах может быть получена как из объективных, так и из субъективных источников. К объективным источникам относятся официальная государственная статистика, статистика министерств и ведомств, служб социальной защиты, профессиональных союзов, общественных партий и движений и т.п. Такие данные, как правило, касаются обобщенных количественных характеристик социальных общностей, явлений, процессов, напри­мер, численность населения, уровень безработицы, средняя зарпла­та, национальный валовой продукт, численность и состав партий и общественных объединений, реализуемый тираж печатных изданий. Объективное и даже официальное происхождение таких данных не всегда гарантирует их точность и однозначность. Так, существенно расходятся оценки уровня безработицы службами занятости и профсоюзами, которые используют для определения этого уровня разные методики. Средний уровень доходов, определяемый министерством статистики, является заведомо заниженным, так как в нем не учиты­ваются (или учитываются не в полном объеме) заработки в теневом секторе экономики и доходы от индивидуальной трудовой деятель­ности. Заведомо занижены данные о распространенности наркома­нии или пьянства за рулем из-за того, что регистрируются далеко не все случаи этих явлений. А данные о читателях библиотек, напро­тив, завышены, так как библиотека считает своим читателем каждого, кто был в нее записан, даже если человек посетил ее лишь однажды.

Субъективными источниками данных являются сами люди. Только от них можно узнать о настроениях населения или отдель­ных социальных групп, к ним обращаются службы общественного мнения, по их ответам прогнозируют результаты выборов и опреде­ляют рейтинги телепередач. При работе с такими источниками воз­никают, как минимум, две методологические проблемы. Во-первых, данные, полученные от отдельных людей, должны характеризовать изучаемое явление или процесс в целом. Следовательно, они долж­ны быть некоторым образом обобщены. Во-вторых, наиболее точ­ные результаты могут быть получены при исследовании полной со­вокупности объектов, имеющих отношение к изучаемой проблеме, — генеральной совокупности. Лучшим примером подобного исследо­вания является перепись населения. Однако подобные проекты чрезвычайно трудоемки и дорогостоящи, а в информации от субъек­тивных источников общество нуждается постоянно. Поэтому социо­логические исследования в большинстве случаев бывают выбороч­ными. Главной проблемой выборочного исследования является от­бор из генеральной совокупности объектов такой подсовокупности (выборки), которая сделала бы исследование одновременно и пред­ставительным, и экономичным.

Представительностью или репрезентативностью выборки называется ее способность правильно отражать состояние дел в ге­неральной совокупности, из которой она извлечена и для изучения которой предназначена. Понятие эффективности (экономичности) выборки связано со стоимостью исследования. Эффективной называ­ется выборка, которая позволяет получить наиболее точные результа­ты при заданной стоимости исследования либо обеспечить заданную точность результатов при минимальных затратах. Репрезентативность и эффективность зависят от дизайна выборки - стратегии и конкретных процедур ее формирования.

Дизайн исследования определяется его целями, задачами и ги­потезами, а также характеристиками генеральной совокупности. В зависимости от целей и задач различают дескриптивные (описатель­ные), аналитические, полевые исследования и исследования отдель­ных случаев.

Дескриптивные (описательные) исследования, называемые также просто обследованиями, предназначены для получения обоб­щенных характеристик генеральной совокупности. Они бывают сплошными и выборочными, а также разовыми и лонгитюдными. Основным методом сбора информации является интервьюирование (анкетирование).

Сплошное дескриптивное исследование предполагает обсле­дование всей генеральной совокупности, как, например, при пере­писи населения. Собранная информация может быть использована для классификации объектов, получения обобщенных характери­стик генеральной совокупности, измерения связей между показате­лями. Полное обследование позволяет получить абсолютно надеж­ную информацию, но требует значительных усилий и материальных средств.

Выборочное обследование имеет дело не со всей генеральной совокупностью, но только с некоторой ее частью. Для того, чтобы выборка была репрезентативной (позволяла воспроизвести основ­ные характеристики генеральной совокупности), необходимо со­блюдать специальные процедуры. Данные выборочного обследова­ния позволяют оценивать неизвестные характеристики генеральной совокупности, проверять гипотезы, анализировать парные и множе­ственные связи между переменными. Выборочное обследование яв­ляется самым распространенным дизайном в социальных исследо­ваниях, ниже мы рассмотрим его более подробно.

Как сплошные, так и выборочные обследования бывают разо­выми и лонгитюдными. Разовые исследования позволяют получить "срез" информации о состоянии генеральной совокупности в опре­деленный момент времени. При изучении социальных процессов в динамике возможна организация мониторингового исследования как последовательности разовых обследований, проводимых по об­щей программе и инструментарию, для каждого из которых строит­ся новая выборка. Обязательное требование к мониторинговым исследованиям - применение на всех этапах одних и тех жепроцедур формирования выборки.

Исследование случаев (case study) обычно направлено на ин­тенсивный анализ единичных случаев изучаемого феномена. Иссле­дователь интервьюирует индивидуумов или изучает документы ис­тории их жизни, чтобы глубже понять их поведение; пытается опре­делить как уникальные, так и общие черты, свойственные всем людям из данного класса (социальной группы). Для исследования общих тенденций случаи могут быть сгруппированы по типам. Ме­тод эффективен для исследований личности и процессов социализа­ции, разработки новых понятий либо проверки существующих. Данные об отдельных случаях могут быть закодированы для после­дующей статистической обработки.

Сплошное или выборочное обследование генеральной сово­купности может применяться в комбинации с исследованием от­дельных случаев для более глубокого освещения происходящих процессов и наблюдаемых феноменов. Случаи отбираются после обследования таким образом, чтобы продемонстрировать поведение объектов с типичными либо, наоборот, резко выделяющимися ха­рактеристиками. Таким образом, найденные статистические законо­мерности иллюстрируются данными об отдельных судьбах, что по­зволяет изучать и описывать процессы социализации личности с большей глубиной.

Остановимся более подробно на методах выборочного обсле­дования - дизайна, наиболее распространенного в социологических исследованиях. Построение репрезентативной (представительной) выборки невозможно без корректного определения генеральной со­вокупности (ГС), которое далеко не всегда очевидно. Оно включает ответы на следующие вопросы:

- какие именно объекты (элементы) составляют ГС - отдель­ные люди, семьи, академические группы, предприятия, населенные пункты или целые государства;

- какими признаками обладают элементы ГС, насколько они доступны для определения;

- какова численность ГС;

- как ГС размещена территориально;

- как ГС ограничена во времени.

В большинстве социальных исследований в качестве элементов генеральной совокупности выступают обычные люди. Однако это не является общим правилом. В демографических исследовани­ях элементом наблюдения часто является домохозяйство или семья; в микроэкономических исследованиях - домохозяйство, фирма, предприятие; в сравнительных международных исследованиях - го­сударство или регион. Ошибки в определении элементов генераль­ной совокупности приводят к систематическим ошибкам в получен­ных результатах.

По характеру элементов генеральные совокупности (ГС) де­лятся на конкретные и гипотетические. Конкретные ГС состоят из элементов, которые могут быть выделены относительно легко. На­пример, учителя составляют достаточно большую, но конкретную ГС, так как их можно найти и обследовать через министерство обра­зования и школы. Элементы гипотетической ГС обладают характе­ристиками, которые трудно или даже невозможно определить до на­чала исследования. Например, нельзя определить, принадлежит ли человек к зрителям телевизионного шоу, до тех пор, пока он сам не ответит на этот вопрос, или к генеральной совокупности избирате­лей - до того, как он пришел на избирательный участок. К гипоте­тическим генеральным совокупностям относятся аудитория СМИ, сторонники различных учений, потребители некоторых товаров, коллекционеры и т.п.

Численность конкретных генеральных совокупностей в боль­шинстве случаев известна или может быть относительно легко уточнена. Численность некоторых гипотетических ГС, например, национальных меньшинств, тоже может быть определена без боль­ших усилий (например, по данным официальной статистики). До­вольно часто приходится довольствоваться заведомо завышенными или заниженными оценками, основанными на реальных данных. Например, численность читателей библиотеки можно оценить по картотеке, но такая оценка будет завышенной. Оценка численности безработных по картотеке биржи труда или наркоманов по данным наркологической службы будут заведомо заниженными. Наконец, численность таких генеральных совокупностей, как аудитория СМИ может быть оценена только с помощью специального исследования. Иногда бывает полезно различать конечные и "бесконечные" генеральные совокупности. На практике к бесконечным относят ге­неральные совокупности численностью более ста тысяч элементов. Так, вполне конкретную ГС учителей Беларуси можно считать прак­тически бесконечной; а весьма гипотетичная ГС узбеков, проживающих в Минске, является конечной, так как ее численность опре­деленно не превышает нескольких десятков человек.

В соответствии с территориальным размещением генеральные совокупности бывают национальными, региональными, городскими, и т.п. Они могут также ограничиваться принадлежностью к опреде­ленным ведомствам, организациям, сообществам, социальным группам.

Временные рамки генеральной совокупности в большинстве случаев ограничиваются моментом обследования. Однако в некото­рых исследованиях время играет весьма значительную роль. Так, при изучении демографических или миграционных процессов учи­тываются все случаи рождений, смертей, эмиграции, иммиграций на определенной территории за год или за пять лет. В лонгитюдных ис­следованиях время фигурирует как условие выделения генеральной совокупности по принципу образовательной или возрастной когор­ты. Например, в республиканском лонгитюдном исследовании "Пу­ти поколения" ГС была определена как "лица, получившие среднее образование в 1983 году".

Большинство выборочных процедур предполагает, что из­вестны не только общие характеристики, но и списочный состав ге­неральной совокупности. На практике так бывает далеко не всегда, поэтому следующим этапом построения выборки является опреде­ление ее представительной основы - совокупности, из которой вы­борка будет непосредственно формироваться. При опросах взросло­го населения в качестве основы выборки используют картотеку ад­ресного стола, списки избирателей, или списки адресов, которыми располагают коммунальные службы (хотя все эти источники, как правило, не вполне точны); при исследовании читателей прессы -списки подписчиков в почтовых отделениях (хотя газеты читают не только они); при телефонных опросах населения - номера телефо­нов, включенные в городской справочник (хотя значительная часть населения не охвачена этим видом услуг) и т.п.

Поскольку выборка является средством изучения генеральной совокупности, основное требование к ней - возможность обобщения результатов выборочного исследования на генеральную совокуп­ность. Соответствие выборки этому требованию определяет ее ре­презентативность. Выбор конкретных методов формирования вы­борки зависит от характеристик генеральной совокупности, а также имеющихся материальных и временных ресурсов.

Существует два основных подхода к обоснованию репрезен­тативности выборки: статистический и внестатистический. При ста­тистическом подходе репрезентативность обеспечивается специаль­ными вероятностными методами извлечения выборки. Для обобще­ния результатов исследования на генеральную совокупность применяются строгие индуктивные процедуры статистического вы­вода, оценивается ошибка выборки с заданной доверительной ве­роятностью. Внестатистическое обоснование репрезентативности предполагает теоретическое доказательство того, что выборка дос­таточно хорошо представляет генеральную совокупность. При ис­пользовании этого подхода статистическое оценивание ошибок вы­борки не производится.

Поскольку абсолютное большинство методов статистического анализа разработаны для статистически обоснованных (вероятност­ных) выборок, мы будем говорить, главным образом, о них. Разли­чают три основных вида случайного отбора: простой, стратифици­рованный и кластерный. Простой случайный отбор из генеральной совокупности предполагает, что (1) генеральная совокупность одно­родна; (2) все ее элементы доступны для исследования в одинаковой степени; (3) имеется полный список элементов, составляющих гене­ральную совокупность (или хотя бы репрезентативная основа вы­борки); (4) к этому списку применяются процедуры случайного от­бора, с использованием таблиц или компьютерных генераторов слу­чайных чисел. При правильной организации простого случайного отбора все элементы генеральной совокупности имеют одинаковую вероятность попасть в выборку, что значительно упрощает ее стати­стическое обоснование.

Основными проблемами простого случайного отбора являют­ся сложность и неоднозначность понятия однородности генеральной совокупности; невозможность получения представительной основы выборки; разная степень доступности элементов генеральной сово­купности и их готовности участвовать в исследовании.

Однородность генеральной совокупности является одним из наиболее сложных для определения понятий. Она означает не столько одинаковое поведение ее элементов, сколько однородность условий, в которых эти элементы находятся. Условия, по которым контролируется однородность ГС, должны быть тесно связанными с задачами и гипотезами исследования. Так, при экологических ис­следованиях, всю территорию Беларуси делят на две относительно однородные части - загрязненную радиоактивными элементами и "чистую". При исследованиях общественного мнения неодинаково ведут себя городское и сельское население. При предсказании ре­зультатов выборов необходимо принимать во внимание различия в политических симпатиях населения западных и восточных районов страны. В некоторых исследованиях критериями неоднородности могут быть возраст, образование, принадлежность к религиозным конфессиям, даже пол респондента.

Для получения основы выборки применяются два главных подхода, выбор которых зависит от определения генеральной сово­купности. Если она определена по территориальному принципу (как население, проживающее на определенной территории), формиро­вание основы выборки также производится по территориальному принципу - через адресные или справочные столы, по спискам из­бирателей или подписчиков газет, домовым книгам, спискам адре­сов, планам населенных пунктов и т.п. Если генеральная совокуп­ность определяется по производственному принципу, основа выбор­ки формируется по спискам работников предприятий, учащихся учебных заведений, списков членов партий или других сообществ, библиотечных картотек, и так далее. Термин "производственный" здесь трактуется широко, как зарегистрированное членство в любой организации. Возможность получения основы выборки зависит от степени конкретности/гипотетичности генеральной совокупности, ее объема, особенностей организации.

Наконец, необходимо учитывать, что социальные объекты мо­гут проявлять разную степень готовности участвовать в исследовании (вплоть до полного отказа), а также могут иметь разную степень дос­тупности. Например, менее доступными часто оказываются молодые респонденты, особенно мужчины, ведущие мобильный образ жизни; в зимнее время в некоторых районах могут оказаться практически недос­тупными для опроса жители сельской глубинки и т.п.

Таким образом, соблюдение условий простого случайного от­бора возможно не всегда, а если и возможно теоретически, то не всегда приемлемо с экономической точки зрения, так как опрос рес­пондентов, равномерно "рассеянных" на большой территории, и особенно в сельской местности, требует значительных материаль­ных средств. Лучшим, с точки зрения теории выборки, решением этой проблемы является применение других методов случайного от­бора - стратифицированного или гнездового (кластерного).

Стратифицированный случайный отбор заключается в том, что генеральную совокупность разделяют на относительно однород­ные части или слои (страты), для каждой страты определяют собст­венную основу выборки, из которой производят простой случайный отбор. Предполагаемый объем выборки при этом делится между стратами пропорционально их численности, что позволяет обеспе­чить для всех элементов генеральной совокупности одинаковую ве­роятность быть отобранным. Стратифицированный случайный от­бор применяется, когда генеральная совокупность не является одно­родной, а также в тех случаях, когда она слишком велика или имеет сложную структуру, так что основу выборки значительно проще по­лучить для отдельных ее частей, чем для генеральной совокупности в целом. В тех случаях, когда стратификация производится по тер­риториальному принципу, отбор иногда называют районированным. Например, при национальных опросах в Беларуси часто применяют районирование по областям.

Если генеральная совокупность может быть представлена как совокупность относительно мелких групп элементов (кластеров, гнезд), к ней могут применяться процедуры кластерного (гнездово­го) отбора. Основа выборки представляет собой список кластеров, к которому применяется процедура простого случайного отбора. За­тем отобранные кластеры обследуются полностью или выборочно.

Сплошное (серийное) обследование кластеров применяется, если численность групп примерно одинакова, и различия между группами меньше, чем различия между отдельными элементами внутри группы. Примерами серийного отбора являются опросы старшеклассников целыми классами, студентов - академическими группами, рабочих - бригадами и т.п.

Если кластеры не удовлетворяют требованиям серийного от­бора, их рассматривают как некие промежуточные ступени в много­ступенчатом отборе. Например, на территории отбираются в качест­ве кластеров отдельные населенные пункты, в которых затем произ­водится выборочное обследование населения.

Метод случайного кластерного отбора применяется в тех слу­чаях, когда трудно получить репрезентативную основу выборки (по­лучить список кластеров, в любом случае, значительно проще), а также при ограниченных материальных и временных ресурсах, так как групповой опрос по месту учебы или работы или проведение обследования только в некоторых населенных пунктах весьма эконо­мичны.

Наряду с методами случайного отбора на практике использу­ется также ряд квазислучайных методов, не использующих таблицы и генераторы случайных чисел, но позволяющих получить результа­ты, аналогичные результатам случайного отбора. Наиболее попу­лярным из них является систематический отбор. При систематиче­ском отборе основа выборки упорядочивается по какому-либо кри­терию, а затем из упорядоченного списка, с заданным шагом, извлекаются элементы. Критерий упорядочивания должен исклю­чать возникновение в списке каких-либо циклических закономерно­стей. Лучшим критерием для списков людей считается алфавитный порядок. Более крупные объекты (населенные пункты, организации, фирмы) могут быть упорядочены по размеру, объему товарооборота, и т.п. Систематический отбор, как и случайный, может быть про­стым, стратифицированным и кластерным.

Популярным вариантом систематического отбора является "маршрутная" выборка, при которой адреса домохозяйств извлека­ются из списка, упорядоченного по улицам населенного пункта. Вместе с маршрутной выборкой часто применяют рандомизирующие процедуры, призванные обеспечить "случайность" отбора элемента генеральной совокупности в выборку. К ним относятся, например, случайный выбор первого адреса из списка, запрет на обследование подряд однотипных квартир, процедуры случайного отбора респон­дента в семье.

В рамках теории выборки разработаны также разнообразные стратегии и методы, к которым можно обратиться, если случайный отбор невозможен или требует недопустимо высоких затрат. Основ­ным нестатистическим методом извлечения выборок является квотный отбор. Его применяют, если распределение генеральной сово­купности по основным социально-демографическим или другим су­щественным для исследования признакам известно, но ее списки получить невозможно, или если для осуществления случайного от­бора недостаточно времени и средств. В этом случае интервьюерам поручают опросить определенное число лиц с заданными характе­ристиками, отбирая их по своему усмотрению. Квотный отбор кри­тикуется специалистами по теории выборки, главным образом, за то, что точность результатов, полученных по квотным выборкам, не может быть оценена статистически. Тем не менее, он достаточно популярен благодаря своей простоте, относительно низкой стоимости и анонимности. При исследовании общественного мнения, цен­ностей, установок, мотивов квотный отбор обычно дает удовлетво­рительные результаты. Однако его категорически не рекомендуется использовать в исследованиях социальной структуры, стратифика­ции, мобильности.

Метод основного массива применяется на небольших гене­ральных совокупностях, для которых нет смысла проводить выбо­рочное исследование. Обоснование репрезентативности в этом случае носит внестатистический характер, оно осуществляется посредством сравнения исследованной и неисследованной частей генеральной со­вокупности.

Наиболее уязвим, с точки зрения соответствия полученных результатов реальному положению дел, метод доступной выборки, который применяется при исследовании генеральных совокупно­стей, слишком сложных для исследования другими методами. Обычно это гипотетические генеральные совокупности - аудитория СМИ (опрашиваемая непосредственно через СМИ), потребители определенных товаров (опрашиваемые в магазинах), национальные меньшинства, представителей которых опрашивают в культурных обществах или в местах компактного проживания и т.п.

Метод "снежного кома" представляет собой нечто среднее между методами доступной выборкой и основного массива. Он применяется к малочисленным гипотетическим генеральным сово­купностям, например, к коллекционерам или экспертам по узкой проблеме. Каждого найденного члена такой совокупности спраши­вают, кого из своих коллег он мог бы назвать. Полученный список принимается за основу выборки; опрос продолжается до тех пор, пока имена в списке не начнут повторяться.

К большим генеральным совокупностям со сложной структу­рой часто применяют многоступенчатый отбор. Для этого гене­ральную совокупность структурируют, разбивая ее на конечное чис­ло подсовокупностей. Образуется новая, конкретная и конечная, ге­неральная совокупность, элементами (единицами отбора) которой являются выделенные подсовокупности. Часть из них отбирается для продолжения исследования. Эта операция может повторяться несколько раз, пока не будут получены подсовокупности, доступные для непосредственного изучения, причем на разных ступенях могут использоваться разные методы отбора и репрезентации.

При многоступенчатом отборе основой выборки на каждой ступени является список выделенных структурных единиц отбора. На последней ступени единицы отбора совпадают с единицами на­блюдения - объектами из генеральной совокупности, включенными в выборку и подлежащими непосредственному исследованию.

Результаты выборочных исследований всегда являются отчас­ти неопределенными. Это происходит потому, что изучается только часть генеральной совокупности, и измерения производятся с ошиб­ками. Однако при отсутствии грубых просчетов в планировании и реализации выборки эти ошибки можно контролировать, то есть с высокой вероятностью полагать, что они находятся в некоторых пределах, которые представляются исследователю допустимыми.

Обычно выделяют две составляющие ошибки выборки, одну из которых называют систематической, а другую случайной ошиб­кой. Систематическая ошибка представляет собой некоторое сме­щение выборочного среднего значения признака по отношению к генеральному среднему, не уменьшающееся с увеличением объема выборки. Систематические ошибки обычно связывают с ошибками проектирования выборки и ошибками инструментария исследова­ния. Их часто трудно обнаружить и еще труднее измерить; для этого проводятся специальные методологические исследования и приме­няются специальные процедуры тестирования выборки и измери­тельных шкал. Иногда систематические ошибки могут быть опреде­лены, если со временем становится известным распределение при­знака в генеральной совокупности (например, результаты выборов), или в результате скрупулезного анализа артефактов, обнаруженных при анализе данных.

Случайные ошибки связаны с вероятностным характером про­цедур извлечения выборки из генеральной совокупности и ошибка­ми измерения, не имеющими систематического характера. Ошибки такого рода неустранимы, но подчиняются статистическим законам и, соответственно, поддаются контролю. Важнейшее свойство слу­чайных ошибок состоит в том, что они уменьшаются с увеличением объема выборки. Следовательно, увеличивая объем выборки, их можно свести к допустимому пределу, и, тем самым, обеспечить же­лательную степень точности результатов исследования.

Степень точности для каждого показателя, измеряемого в процессе обследования, задается (и измеряется) двумя количествен­ными характеристиками: предельно допустимой величиной ошибки и вероятностью того, что эта величина не будет превышена (довери­тельной вероятностью). Оба эти значения существенным образом зависят от объема выборки и способа ее извлечения. Стремление повысить точность приводит к быстрому росту необходимого объе­ма выборки и, соответственно, стоимости исследования. Таким об­разом, каждая реализованная выборка является компромиссом меж­ду желательной степенью точности и имеющимися в распоряжении исследователя временными и материальными ресурсами.

Итак, ошибкой выборки (А) называется разность между сред­ними арифметическими значениями признака по выборке и по гене­ральной совокупности:

где х - среднее арифметическое значение признака по выборке; μ - среднее арифметическое значение признака по генеральной совокупности.

Таким образом, ошибка выборки измеряется в тех же едини­цах, что и измеряемый показатель. Поскольку в реальном исследо­вании среднее значение признака по генеральной совокупности (μ) обычно неизвестно (напротив, исследование проводится с целью его оценить), ошибка выборки не может быть вычислена точно, а только оценена статистическими методами. Сразу оговоримся, что стати­стическое оценивание ошибок возможно только для вероятностных выборок, на всех ступенях которых применяются случайные методы отбора, и при этом оценивается только случайная составляющая ошибки, а ее систематическая составляющая полагается равной ну­лю. Мы рассмотрим наиболее простой случай оценивания ошибки и объема выборки - при простом случайном отборе.

Случайные ошибки простой случайной выборки из бесконеч­ной генеральной совокупности имеют распределение, близкое к нормальному (Гауссовому), с нулевым средним и дисперсией, рав­ной σ2/n, где σ 2 - дисперсия признака по выборке, n - ее объем.

Величина Δст =σ/√n называется стандартной ошибкой выборки.

Из свойств нормального распределения следуют два важных обстоятельства. Во-первых, значения таких ошибок обычно невели­ки. С вероятностью (1-а) они не выходят за пределы так называе­мого доверительного интервала, который имеет вид:

 (1)

или

                  (2)

Вероятность а выбирается заранее. Наиболее часто использу­ются значения а = 0.01, 0.05 или 0.1. Соответствующие уровни до­верительной вероятности (1-а) составляют 0.99, 0.95 и 0.9. Дове­рительный коэффициент Z1- α /2 соответствующий доверительной вероятности (1 — α), определяется по таблице стандартного нормаль­ного распределения. Перечисленным уровням вероятности соответст­вуют значения доверительного коэффициента, равные 2.58; 1.96; 1.65. Во-вторых, стандартная ошибка выборки Δст и диапазон изменения случайной ошибки выборки Δ обратно пропорциональны √n , сле­довательно, их можно контролировать, увеличивая объем выборки.

Формулы (1) и (2) применяются для оценивания ошибки вы­борки после завершения исследования. Однако во многих случаях необходимо до его начала определить, какой объем выборки при выбранном дизайне может обеспечить необходимую точность ре­зультатов. Желательная точность результатов (для конкретного при­знака) задается двумя численными величинами: предельно допусти­мым значением ошибки Δдоп и вероятностью превысить эту ошибку а. Для простой случайной выборки из бесконечной генеральной со­вокупности эти две величины связаны с дисперсией признака по ге­неральной совокупности а2 и объемом выборки п выражением

             (3)

откуда

                            (4)

В этой формуле предельная ошибка выборки Δдоп и вероят­ность а задаются исследователем произвольно, а дисперсия гене­ральной совокупности, если она неизвестна, должна быть предварительно оценена, например, с помощью пилотажного исследования.

Степень точности одной и той же выборки для разных показа­телей может существенно различаться. В этой сложной ситуации мы рекомендуем ориентироваться, в первую очередь, на достижение удовлетворительной точности для признаков, наиболее важных с точки зрения целей исследования.

Если генеральная совокупность конечна, и ее объем сравним с объемом выборки, дисперсию ошибки выборки следует вычислять с поправкой на объем генеральной совокупности. Она будет равна:

где N - объем генеральной совокупности. Следовательно, формула для оценивания ошибки выборки примет вид:

         (2а)

а формула для вычисления необходимого объема выборки:

           (4a)

Приведенные выше формулы справедливы для простой слу­чайной выборки. При более сложном дизайне применяются более сложные оценки дисперсии выборочной ошибки и необходимого объема выборки. С этими вопросами можно познакомиться в специ­альной статистической литературе.

 

Вопросы для самоконтроля и повторения

1. Выберете подходящий дизайн для исследования:

а) самочувствия национальных меньшинств;

б) проблем наркоманов;

в) рейтинга телевизионных программ;

г) межличностных отношений в студенческой группе.

2. а) Определите генеральную совокупность для изучения бытовых проблем в студенческом общежитии вашего университета: состав, конкретность/гипотетичность, численность, структуру, б) Разработайте выборку для такого исследования.

3. 3. В каких единицах будет определяться ошибка выборки при иссле­довании:

а) доходов;

б) коэффициента интеллекта IQ;

в) возраста;

г) при предсказании результатов выборов?

4. а) Определите ошибку выборки, если по прогнозу ожидалось, что за кандидата в депутаты проголосует 49 % избирателей, в то время как реально проголосовали 51 %.

б) Можно ли с вероятностью 0.99 утверждать, что эта ошибка явля­ется случайной, то есть может быть объяснена последствиями слу­чайного отбора, если объем простой случайной выборки составил 1600 человек, а дисперсия равна 0.25?

в) С какой максимальной вероятностью можно утверждать, что ошибка выборки является случайной?

г) Какой объем выборки понадобился бы, чтобы при той же диспер­сии ошибка выборки с вероятностью 0.99 не превысила 1 %?

 

Литература

1. Кокрен У. Методы выборочного исследования. М., 1976.

2. Методы сбора информации в социологическом исследовании: В 2-х кн. М., 1990.

3. Ноэль Э. Массовые опросы: введение в методику демоскопии. М., 1978.

4. Оперативные социологические исследования. Мн., 1997.

5. Паниотто В.И. Качество социологической информации. Киев, 1986.

6. Территориальная выборка в социологических исследованиях. М., 1980.

7. Чурилов Н.Н. Проектирование выборочного социологического ис­следования. Киев, 1986.

8. Шляпентох В.Э. Проблемы репрезентативности социологической информации (случайные и неслучайные выборки в социологии). М., 1976.

9. 9. Шэреги Ф.Э., Гуцу В.Г., Папоян Г.Р. Выборка в опросах общест­венного мнения: учебное пособие. Кишинев, 1989.

 










Последнее изменение этой страницы: 2018-05-10; просмотров: 220.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...