Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Перекодирование значений и операция ранжирования




Первоначально собранные данные можно перекодировать с помощью средств SPSS. Перекодирование численных данных необходимо, например, тогда, когда первоначальное разнообразие исходных данных не требуется для последующего анализа. В этом случае перекодирование означает уменьшение объема обрабатываемой информации. Так, в примере, приведенном ниже, 9 образовательных групп будут преобразованы в 4.

Возможны два способа перекодировки – либо создается новая переменная либо исходная переменная преобразуется согласно заданным условиям.

 

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

Задача 1. Создать новую переменную, перекодировав данные для переменной «Уровень образования». Осуществить преобразование 9 уровней в 4 уровня, согласно приведенной ниже таблице.

1. Загрузите файл Социальная стратификация.sav в Редактор данных.

2. Выберите п.м. Преобразовать/Перекодировать в другие переменные  и перенесите переменную q3 (образование) в поле Числовая переменная, а в поле Метка – обозначение: «Уровень образования».  

3.  Использовать на кн. Старые и новые значения, где необходимо указать значение или диапазон входной переменной и соответствующее значение выходной переменной. 

Введите старые и новые значения:

старые новые
1,2 и 3
4 и 5
6 и 7
8 и 9
99 Системные пропущенные

 

Выбранные опции соответствуют следующему командному синтаксису:

RECODE q3 (1 thru 3=1) (4 thru 5=2) (6 thru 7=3) (8 thru 9=4) INTO obraz. VARIABLE LABELS obraz 'новое образование'.

4. Выполните частотный анализ.  

5. Организуйте новую переменную, отобрав при помощи кн.Если только тех респондентов, которые получили платное образование (q5=1).

Задача 2. Создать новую переменную, перекодировав данные для переменной «возрастные группы» в файле Социальная стратификация.sav согласно приведенному командному синтаксису RECODE age (1 thru 3=1) (4 thru 5=2).



Операция ранжирования

Команда Преобразовать/Ранжировать наблюдения также позволяет создать новую переменную, значения которой – ранговые места наблюдений по заданной переменной. Эта процедура применяется, когда необходимо перейти от исходных значений переменной к рангам.

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

Задача 1. Создать новую переменную для данных «начальная заработная плата» (которой автоматически присваивается имя Nsalbegin), присвоив данным 10 рангов в ф. Служащие.sav.

1. Загрузите файл Служащие.sav в Редактор данных.

2. Выберите п.м. Преобразовать/Ранжироват переменные  и перенесите переменную salbegin в поле Переменные.

3. При помощи кн. Типы рангов присвоить № Разбиения равным 10

4. Построить частотное распределение и диаграмму для новой переменной. Сделать выводы.

 

Отбор данных

Отбор данных — это выбор наблюдений по определенным критериям

Отбор данных можно также интерпретировать как отбор случаев по определенным категориям, например, выбрать тех респондентов, которые потратили на получение образования некоторое количество лет или отобрать мужчин, голосующих за определенную партию. Таким образом, можно задать один, два или более критериев отбора. После осуществления операции остальные случаи не будут подвергаться обработке, то есть после выполнения операции отбора все вычисления будут проводиться только по отобранным наблюдениям.

Случаи, не удовлетворяющие условиям отбора, визуально реализуются как перечеркнутые строки в окне Данные.

В SPSS существует 3 возможности отбора:

1. выбор наблюдений по определенному условию (логическому выражению);

2. извлечение случайной выборки наблюдений из файла данных осуществляется в случае, когда возникает необходи­мость отбора респондентов не по конкретному условию, а случайным образом (то есть формирование случайной выборки). Эта возможность полезна для уменьшения размера исходной выборки, например, для выполнения статисти­ческих процедур, предъявляющих повышенные требования к вычислительным ресурсам компьютера.

3. разделение наблюдений на группы в соответствии со значениями одной или нескольких переменных.

 

Выбор наблюдений по условию

Осуществляется командой Данные/Отобрать наблюдения/Если выполняется условие/кн. Если.

Диалоговое окно Отобрать наблюдения: Условия содержит следующие элементы:

· Список переменных, содержащихся в файле данных.

· Редактор условий для записи логического выражения, по которому должны быть отобраны наблюдений. 

· Клавиатура, содержащая цифры, арифметические, логические операторы и операторы отношения.

· Список функций, содержащий около 140 функций, каждую из которых можно скопировать в редактор условий двойным щелчком.

В программе используется следующая классификация операторов.

 Арифметические операторы применяются в математических формулах, которые при отборе данных имеют лишь второстепенное значение. Арифметические операторы всегда можно использовать в логических выражениях, их также используют при модификации данных (расчет новых переменных).

Операторы отношения

Отношение – это логическое выражение, в котором два значения сравниваются друг с другом посредством оператора отношения. 

Такие логические выражения могут быть введены в окно Редактора условий посредством клавиатуры

Например: sex = 2 & age > 30

Для построения логических выражений могут применяться следующие операторы отношения:

Знак Альтернативный текст Значение

Операторы отношения

< LT меньше
> GT больше
<= LE меньше или равно
>— GE больше или равно
= EQ равно
~= NE или <> не равно

Логические операторы

& AND Логическое И
| OR Логическое ИЛИ
~ NOT Логическое НЕ

 

Приоритеты между логическими операторами:

Приоритет Оператор
1 NOT
2 AND
3 OR

 

Логические операторы основаны на принципах булевой алгебры (логики высказываний).

Булева алгебра

Выражение 1

Выражение 2

Оператор И (конъюнкция) Оператор ИЛИ (дизъюнкция) Оператор НЕ (конъюнкция)

Результат

и и и и л
и л л и
л и л и
л л л л и

 

Примеры:

Выражение Истинность
(3<7) AND (8>5) и
(12=8) AND (4=4) л
(3<=5) AND (4>=1) и
(8=4) AND (7=3) л

Примеры:

Выражение Истинность
NOT [(3<5) AND (4>5)] и
NOT [(4<5) AND (8<12)] л

При отрицании следует учитывать эквивалентность операторов:

отрицаемый оператор эквивалентный оператор
< > =
> < =
<= >
> = <

 

Пример более сложного логического выражения:

[(NOT A) AND (NOT В)] OR С

Согласно правилам приоритета скобки здесь не нужны. Мы поместили их только для повышения наглядности. Истинность выражения можно определить при помощи следующей таблицы:

А В С NOT A NОТ В (NОT A) AND (NОT В) OR С
и и и л л л и
и и л л л л л
и л и л и л и
и л л л л л л
л и и и л л и
л и л и л л л
л л и и и и и
л л л и и и и

Пример:

Высказывание: "Я был в кино и видел интересный фильм",

истинно тогда и только тогда, когда истинны обе его части. Если, несмотря на то, что вы ходили в кино, но на сеансе заснули от скуки, это выражение не будет истинным. Также оно не будет истинным, если вы смотрели интересный фильм по телевизору. И, конечно же, оно будет совершенно ложным (хотя здесь нас не интересует степень ложности), если вы и не были в кино, и не смотрели там интересный фильм. Иначе обстоит дело при разговорном применении союза "или", которое в основном означает исключающее "или", когда, например, дети хотят получить на Рождество или компьютер, или велосипед.

Логические функции

Функции переносятся в редактор условий следующим образом:

1. Поместите курсор на место в условном выражении, на котором должна быть вставлена функция.

2. Дважды щелкните на функции в списке функций или выделите функцию и щелкните на кнопке с треугольником около списка функций.

3. Вместо аргументов в этой функции будут стоять вопросительные знаки, количество которых указывает минимальное количество аргументов.

Отредактировать функцию можно следующим образом:

1. Выделите вопросительные знаки во вставленной функции.

2. Замените их соответствующими аргументами. Имена переменных для аргументов можно перенести из списка исходных переменных.

 

В SPSS реализована логическая функция ранжирования, предназначенная для отбора как количественных, так и качественных данных, удовлетворяющих некоторым условиям.

При помощи  команды Данные/Отобрать наблюдения/Если выполняется условие/кн.Если, вдиалоговом окне Отобрать наблюдения: Условия возможен выбор Групп функций/Все.

Функция RANGE определяет новую дихотомическую переменную, которой системой  автоматически  присваивается имя filter_S со значениями 0 – не выбрано, 1 – выбрано. Значение «1» присваивается в случае, если значение переменной лежит в диапазоне между заданными начальным и конечным значениями. Значение «0» присваивается в случае, если значение переменной не принадлежит заданному диапазону значений.










Последнее изменение этой страницы: 2018-04-12; просмотров: 404.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...