Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев… - стр. 25
Для преобразования в Excel Вы добавляете колонку и используете формулу ЕСЛИ, чтобы на основании данных колонки «количество детей» вывести новую переменную (рис. 19).
Рис. 19. Перекодирование в Excel через формулу =ЕСЛИ
В PSPP необходимо будет использовать функцию TRANSFORM / COMPUTE или RECODE или ПРЕОБРАЗОВАТЬ / ВЫЧИСЛИТЬ или ПЕРЕКОДИРОВАТЬ…: с ее помощью можно на основании имеющихся переменных вычислить любые другие переменные (рис.20).
Рис. 20. Перекодирование в PSPP
Кого картинки с формулами и окнами «напрягли» – «спокойствие, только спокойствие»: они не страшны, да и работа с ними занимает на самом деле секунды. Выглядят просто эти окна страшнее, чем для даже более сложных видов в анализа. Как я говорил, с этими функциями (как в Excel, так и в PSPP) мы еще отдельно познакомимся далее по ходу книги.
Что стоит еще просто упомянуть в части подготовки массива к анализу.
Есть еще процедура нормирования всего массива – приведение всех переменных к % значениям или вычитанием среднего с последующим делением на стандартное отклонение – но в этих вычислениях Вас запутывать не буду.
Есть еще взвешивание. Вам пока этим также баловаться не нужно – и вряд ли работая в организациях (кроме исследовательских социологических или маркетинговых агентств) Вы с такой необходимостью столкнетесь.
Процедуру взвешивания чаще всего используют опытные социологи и политтехнологи. Особенно когда «на заказ» необходимо получить нужные результаты опроса: просто всегда можно подобрать для взвешивания массива какую-то переменную, чтобы получить нужные результаты.
Например, в опросе реально приняли участие 30% женщин и 70% мужчин, что отражает состав исследуемого региона и под это строилась выборка. Но результаты получились совсем не для PR и формирования мнения избирателей… А вот если «взвесить» массив по общепринятому распределению мужчин и женщин в мире или стране мы можем получить ближе к тому, что будет выглядеть более красиво. Проделывается процедура взвешивания по «целесообразному» распределению (потом в случае вопросов всяких «умников» полученные результаты обосновываются взвешиванием массива по некой «классической норме для М и Ж»).
Теперь Вы подготовили данные к анализу – можем начинать анализ. Только для отработки навыков Вам нужно работать с массивами прямо в программах.
На курсах и тренингах слушатели работают с моими массивами данных из разных проектов. Но при работе с книгой Вам нужно использовать собственные массивы данных – возьмите его на предприятии, по результатам опроса, собственную базу клиентов, если Вы фрилансер, или на худой конец скачайте какие-то данные из интернета.