Анализ и обработка социологической информации
Введение
Заключительный этап эмпирического социологического исследования предполагает обработку, анализ и интерпретацию данных, получение эмпирически обоснованных обобщений, выводов и рекомендаций.
Обработка данных включает в себя следующие компоненты:
Редактирование и кодирование информации. Основное назначение этого шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.
Создание переменных. Собранная на основании анкет информация в ряде случаев прямо отвечает на те вопросы, которые необходимо решить в исследовании. Вопросы получили форму индикаторов в процессе операционализации. Сейчас же необходимо провести обратную процедуру, то есть перевести данные в форму, которая бы отвечала на вопросы исследования.
Статистический анализ. Этот шаг является ключевым в процессе анализа социологических данных. В ходе статистического анализа выявляются некоторые статистические закономерности и зависимости, которые позволяют социологу сделать определенные обобщения и выводы. Для проведения статистического анализа социологи используют большое число различных математических методов, позволяющих полно и всесторонне анализировать собранную информацию. В современной социологии для этой цели активно применяются ЭВМ, дополненные программами математико-статистической обработки.
В зависимости от методов получения первичной информации возможно применение различных приемов обработки и анализа данных. Так, если социолог определенную часть информации извлекает из документальных источников, то он использует два основных метода анализа документов. Неформализованный (традиционный) и формализованный (контент-анализ). Традиционный анализ основан на восприятии, понимании, осмыслении и интерпретации содержания документов в соответствии с целью исследования. Формализованный анализ документальных источников (контент-анализ — анализ содержания) рассчитан на извлечение социологических информации из больших массивов документальных источников, недоступных традиционному интуитивному анализу.
1. Описание информации и вычисления обобщающих параметров
В эмпирической социологии накоплено немало статистических процедур, с помощью которых разрозненные данные, содержащиеся в отдельных анкетах или других материалах социологических исследований, адаптируют для обобщения, описания, анализа, научной интерпретации. По результатам обобщений составляют определенные выводы, которые решают задачи, поставленные в исследовании. В результате этих процедур появляется реальная возможность выяснить тенденции в исследуемых процессах, явлениях, выработать прогнозы и практические рекомендации, открывающие выход социальной информации в социальную практику. Чаще статистические методы анализа социальной информации используют для:
— Описания информации и вычисления обобщающих параметров (одномерная статистика);
— Измерения связи между отдельными признаками, полученными в ответах на различные вопросы анкеты, если в качестве метода сбора данных применялось опроса, или контент-анализ текстов СМИ, если использовался метод анализа документов (двумерная статистика);
— Проведение сложных математических процедур, позволяющих проанализировать одновременно несколько взаимосвязанных признаков (многомерная статистика).
Применение методов математической статистики обеспечивает:
— Краткое описание первичной социологической информации, вычисления одномерных распределений, наглядное представление ее в виде таблиц, графиков, диаграмм;
— Вычисление связей между признаками изучаемого общественного явления, оценку их с помощью статистических коэффициентов связи, применение корреляционного, регрессионного анализа и т.д.;
— Установление латентных (скрытых) факторов, которые определяют взаимосвязи внутри группы, признаков изучаемого явления (факторный, латентно-структурный анализ);
— Классификацию признаков и объектов, построение типологий (кластерный анализ, дискриминантный анализ, факторный анализ);
— Проверку (подтверждение или опровержение) исходных гипотез исследования, формулирование новых проблем;
— Выработка краткосрочных и долгосрочных прогнозов относительно функционирования и развития определенного общественного явления.
Использование методов математической статистики предполагает определенный набор предварительных процедур, к которым относятся: подготовка анкеты, другого первичного материала до обработки, которая может осуществляться вручную или автоматизировано; выбор уровня будущего анализа (описательный или объяснительный); выбор конкретных статистических процедур для обработки информации.
В эмпирическом исследовании социолог изучает некоторое множество объектов, например, коллектив работников предприятия. Каждому элементу множества присущи определенные свойства (признаки), скажем, пол, возраст, удовлетворенность условиями труда. Каждый объект имеет определенное значение по каждому признаку. Так, работник имеет одно из двух возможных значений признака «пол» (мужская или женская), одно из трех возможных значений признака «удовлетворенность условиями труда» (доволен, не совсем доволен, совсем недоволен), определенное значение признака «возраст» (число полных лет от 18 до 80) и др.
Как правило, для упрощения обработки все значения признаков кодируют числами, поэтому данные для обработки составляют прямоугольную таблицу (матрицу) чисел. Каждая строка этой таблицы соответствует одному объекту, а каждый столбик — определенному признаку. На пересечении определенной строки и столбца этой таблицы находится значение определенного признака определенного объекта.
Признаки разделяют на качественные и количественные. Качественные признаки не имеют количественного выражения («пол», «удовлетворенность условиями труда»). Количественные признаки имеют единицы измерения. Например, единицей измерения количественного признака «возраст» является год, «заработная плата» — гривна. Эти признаки еще называют признаками, заданными в метрической шкале.
При кодировании значений качественного признака числами возможны два существенно различные варианты. В первом значение качественного признака можно упорядочивать, т.е. для любой пары значений можно указать, какое из них соответствует сильному выявлению признаки. Например, значение «доволен» соответствует интенсивным выявлением признаков «удовлетворенность условиями труда», чем значение «не совсем доволен». В таком случае целесообразно и числовые коды подбирать так, чтобы сильному выявлению признака соответствовало большее число. Так, для признака «удовлетворенность условиями труда» можно выбрать следующие числовые коды значений: 3 — «доволен»; 2 — «не совсем доволен»; 1 — «совсем недоволен». Такие качественные шкалы называют порядковыми шкалами, или шкалами рангов. Во втором случае значение качественного признака не поддаются коем содержательном благоустройству. Например, признак «пол» содержит два значения — «мужская» и «женская». Для значений признаков такого типа можно подбирать любые числовые коды. Главное — чтобы разные значение имели различные коды (т.е. нельзя кодировать два разных значения признака одним числом). Такие качественные шкалы называют номинальными шкалами. Как правило, для кодирования значений признаков в номинальных шкалах используют целые положительные числа — 1, 2, 3 и т. д.
Социологу постоянно приходится при составлении программы исследования выбирать (или даже самостоятельно конструировать) шкалы. От того, насколько удачно это будет сделано, во многом зависит результат обработки полученных данных. Кроме того, выбор математического метода анализа данных тесно связан со шкалами соответствующих признаков. Если такой метод не соответствует данным, это очень существенная методическая ошибка, может свести на нет работу по сбору данных и вычисления результатов.
Чтобы первичные данные можно было использовать для содержательного анализа и выводов, они должны быть независимо упорядочены и проработаны. С этой целью применяют специальные статистические методы — группировки, вычисления обобщающих параметров и коэффициентов, корреляционный, кластерный, факторный анализы и др. Независимо от метода анализа, обработки данных начинают с предварительного упорядочения информации, в основном с помощью статистического группировки и построения статистических таблиц.
Структуру совокупности объектов с точки зрения одной выделенной признаки целесообразно изучать по таблице, в которой для каждого из возможных значений признака зафиксировано, сколько раз встречаются в совокупности объекты, имеющие соответствующее значение.
Одной из важных задач анализа является установление и оценка взаимосвязей между отдельными признаками для определенной совокупности объектов. Эту работу начинают с построения корреляционных таблиц (таблиц сопряженности двух признаков, двумерными таблицами). Они позволяют упорядочивать информацию о распределении совокупности объектов по двум признакам. Такие таблицы имеют прямоугольную форму. Количество строк в них равно количеству возможных значений одного признака, а количество столбцов — количеству возможных значений второго признака.
Умение читать двумерные таблицы приходит с опытом. Нелегко находить закономерности в достаточно больших по размеру таблицах. Кроме того, далеко не всегда связь между признаками прослеживается. Поэтому на практике наличие связи между двумя признаками устанавливают с помощью так называемого критерия 2, основанного на анализе частот, записанных в ячейках таблицы. Это позволяет сделать выводы о том, можно выдвигать и анализировать гипотезу о наличии связи между двумя признаками.
Применяя указанный критерий, необходимо вычислить коэффициент хи-квадрат по формуле (формула зависит от частот в ячейках таблицы и маргинальных частот), а полученное значение сравнить с табличным (критическим). При этом следует иметь в виду определенный уровень значимости (вероятность принятия ошибочного решения) — в социологии, как правило, 0,05 или 0,01. Кроме того, табличное значение зависит от числа степеней свободы, определяют по количеству строк и столбцов таблицы. Итак, для заданного уровня значимости и числа степеней свободы необходимо найти в таблице критическое значение и сравнить его с вычисленным. Если вычисленное значение больше критического, то факт существования связи можно считать установленным.
Силу связи можно оценить вычислением и анализом коэффициентов сопряженности (Пирсона, Чупрова, Крамера). Значение этих коэффициентов находятся в интервале от нуля до единицы и имеют следующее содержание: чем ближе значение к единице, тем теснее связь. Если оба признака, между которыми изучают связь, имеют только по два значения (т.е. фиксируют наличие или отсутствие данного признака в объекте), то для таких «четыреклеточных» таблиц вычисляют коэффициенты ассоциации и контингенции.
Если определенному значению одной величины соответствует совокупность значений второй, то между этими двумя величинами существует корреляционная связь. Он проявляется тогда, когда на исследуемое явление влияет не один, а множество факторов. Например, стаж влияет на производительность труда, но не окончательно определяет ее, потому зависит от уровня образования, возраста, квалификации работника и других факторов. Поскольку явления общественной жизни сложные и многофакторные, связь между признаками в социологии практически всегда корреляционная.
Если каждому значению одного признака соответствует совокупность значений второго признака, близлежащих возле своего среднего значения (т.е. все значения совокупности не отличаются от своего среднего арифметического), то такой корреляционная связь считают сильнее. Количественно силу корреляционной связи оценивают с помощью коэффициентов корреляции.
Для количественных признаков часто используют коэффициент Пирсона (г), который оценивает силу связи по линейной корреляции (т.е. в предположении, что значение одного признака связаны с соответствующими средними второго признака линейной зависимостью). Все значения коэффициента корреляции Пирсона принадлежат интервалу от -1 до 1 Знак коэффициента показывает направление связи: положительное значение свидетельствует о «прямой» связи (рост одного признака обусловливает рост второй), отрицательное значение — о «обратный» н ‘связь, а значение «О» — об отсутствии линейной корреляционной связи. Например, связь между заработной платой рабочего и количеству произведенных им деталей — прямой, а между заработной платой и количеством бракованных деталей — обратной. При г = 1 или г = -1 имеем функциональная связь между признаками (т.е. каждому значению одного признака соответствует одно значение второго признака и эти значения связаны линейной зависимостью). Итак, чем дальше значение коэффициента Пирсона от нуля (чем больше его абсолютная величина), тем теснее линейный корреляционный связь между признаками. Но если г = 0, то это означает отсутствие только линейной связи, а не отсутствие связи между признаками вообще: связь может существовать, но нелинейная. Для оценки силы нелинейной связи используют корреляционное отношение, приобретает значение между 0 и 1 (0 означает отсутствие связи, 1 — функциональная связь).
Для признаков, заданных в порядковых шкалах, вычисляют ранговые коэффициенты корреляции (Спирмена и Кендела), которые также приобретают значение между -1 и 1 и интерпретируются так же, как и коэффициент корреляции Пирсона.
Установка корреляции между двумя признаками еще не означает установления причинной связи между ними. Это лишь свидетельство того, что один из признаков частично повлекла другой или оба признака и является следствием некоторых общих для них причинам. Заметим, что количественная оценка корреляционных связей не может заменить специальных знаний, но может помочь исследователю отбросить несущественные связи, четче очертить направление поисков, сравнить влияние различных факторов и т.п.
Кроме того, коэффициенты частичной корреляции позволяют оценить связь между двумя признаками, вызванной одной или нескольких других признаков. Если после устранения влияния третьего признака коэффициент корреляции между двумя признаками увеличивается, то третий признак ослабляет связь, а если уменьшается, то именно эта третья признак определенной степени вызывает наличие этого взаимодействия (связь, возможно, является лишь следствием влияния этой третьей признаки). Вычислить коэффициенты частичной корреляции достаточно сложно через коэффициенты корреляции Пирсона.
Объем вычислений растет с количеством признаков, влияние которых желают устранить. Силу общего связи совокупности признаков позволяет оценить коэффициент множественной корреляции.
Методы регрессионного анализа обеспечивают не только оценку силы связи между двумя признаками, но и установление вида этой связи в виде уравнения (уравнения регрессии), описывающего зависимость между средним значением одного признака (зависимой, поведение которой изучают) и значениями определенной совокупности признаков (независимых, влияние которых на зависимую признак пытаются оценить). В социологических исследованиях, как правило, происходит поиск такой зависимости в линейном виде (в виде линейного уравнения), поэтому речь идет об уравнении многомерной (множественной) линейной регрессии.
2. Основные этапы обработки эмпирических данных
Анализ собранной социологической информации — самый увлекательный этап исследования. Здесь проверяются выдвинутые гипотезы, выявляются новые проблемы, а иногда ждет и разочарование.
Для начала группировки и классификация — элементарные процедуры упорядочения собранной информации.
Простая группировка — это классификация или упорядочение данных по одному признаку. Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образования или высказанную суждению. Число членов выделенной группы называют долей или относительной частотой. Здесь сразу можно применить такие статистические приемы обработки информации, как вычисления медианы, среднеарифметическим показателем, вычисления частот по процентам.
Перекрестная группировка — это связывание данных, предварительно упорядоченных по двум признакам в таблицах. Например, возраст человека и возраст жены в семейных парах или отношения к проводимым в стране экономических реформ в зависимости от возраста, материального положения. Основная задача перекрестной группировки — поиск устойчивых связей исследуемых объектов, например, типичных соотношений возраста семейных пар. Выясняется, что мужчины в большинстве случаев старше своих жен. Но в новых городах Севера, где достаточно специфический демографический состав населения, довольно много семейных пар, где жена старше мужа.
Такая группировка в некоторых случаях уже является достаточным для основательного отчета по результатам исследования.
Далее возможны эмпирическая типологизация, поиск устойчивых сочетаний свойств социальных объектов не по одному или двум, а в нескольких измерениях одновременно. Например, в семейных парах возраст супругов анализируется в зависимости от национальности, места проживания, характера труда и т. п. Задачу многомерной эмпирической типологизации решают с помощью математических процедур распознавания образов — таксономии. В эмпирическом материале для таксономического анализа выделяются группы — таксоны, например, по семейному положению, и затем анализируется их миграционное поведение, по характеру миг рационных потоков в зависимости от численности поселенческих образований (крупных, средних и малых городов, сел).
В многомерной эмпирической классификации используется прием кластерного анализа. Например, конфигурация депутатских групп в органах представительной власти, позволяет прогнозировать их поведение.
В специальной литературе рассматриваются более сложные приемы анализа информации: критерий Юла, метод корреляционного графа, факторный анализ, различные коэффициенты, например Пирсона.
Как правило, социологи используют стандартные компьютерные программы обработки социологической информации, пригодные для выдачи простых распределений, процентов, отклонений, ранговых и парных коэффициентов корреляции, энтропии, регрессионных показателей, различного рода индексов и т. п.
В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным. В зависимости от целей исследования можно остановиться на определенном этапе анализа информации.
В процессе обработки данных социологических исследований можно выделить следующие содержательные этапы:
1) кодирования информации;
2) ввод информации в компьютер;
3) проверка введенных данных и корректировки ошибок;
4) проведение вычислений и анализ результатов.
Если предполагается обработка данных на компьютере, следует вместе со специалистом по информатике метод кодирования собранной информации (нумерация вопросов и вариантов ответов в анкете для опроса, нумерация пунктов и вариантов значений в кодирующих листке контент-анализа и др.) согласовать с возможностями соответствующего программного обеспечения. Есть ряд общепризнанных стандартов на кодирование информации. Например, имеются пакеты программ, требующих нумеровать все варианты ответов в анкете последовательными натуральными числами (1, 2, 3 …), а есть другие, которые настаивают на нумерации вариантов ответов отдельно в пределах каждого вопроса.
Таких примеров можно привести очень много. Поэтому метод выбран без учета возможностей и особенностей программного обеспечения метод кодирования может привести к необходимости после завершения сбора информации проводить большую ручную работу с перекодирования информации перед вводом ее в компьютер.
В ряде ситуаций для одной части значении выбирают коды к началу сбора информации, для второй — коды выбирают только после того, как всю информацию собрано (на пример, открытые вопросы в анкетах для опроса). Эту работу также следует планировать с учетом методов будущей обработки и возможностей программного обеспечения.
После того как информация собрана и закодирована, переходят где ввод данных в компьютер. Эта трудоемкая работа требует много времени. Вводят данные, как правило, не социологи, а операторы. Они должны быстро и без ошибок перенести закодированную информацию с одного носителя (например, бумага) на другой (магнитный диск) и не принимать никаких решений по этой информации (например, решать, вводить анкету, не целиком заполнена). Поэтому даже в случае, когда все коды выбраны до начала этапа сбора информации, перед тем как передать собранную информацию до введения, следует внимательно просмотреть все анкеты.
В процессе ввода операторы могут допускать ошибки. Кроме того, ошибки могут быть и в самих анкетах. Так, в ответе на вопрос анкеты «Где вы сейчас работаете?» респондент указал, что он безработный, а на вопрос «Кем вы сейчас работаете?» (на другой странице анкеты) дал ответ — «слесарем». Поэтому либо в процессе ввода (что более желательно), или сразу после окончания введения следует проконтролировать введенную информацию и либо скорректировать ошибки (если это ошибки ввода), или отбросить те анкеты, содержащие недостоверные данные. Для этой работы желательно иметь специальные программы, которые на основе требований социологов отбирают те анкеты, этих требований не удовлетворяют. Требования касаются возможных значений кодов для определенных признаков. Например, «Коды признаки 23 должны быть только 1, 2, 3» или «Если признак 23 имеет значение 3, то признаки 24 и 26 имеют иметь значение или 2, или 0».
Только после завершения контроля начинается собственно анализ данных — построение таблиц, вычисления статистических показателей, проверка статистических гипотез, построение новых (дополнительных) признаков и др.
Результаты вычислений на компьютере подаются в большинстве случаев в виде напечатанных на бумаге таблиц. Полезным для содержательного анализа данных является представление результатов в виде различного типа графиков (гистограмм, диаграмм, полигонов и т.д.). Графики позволяют наглядно представить связи и зависимости между признаками, делают анализ более эффективным.
3. Обработка и анализ социологических данных
Полученная в ходе социологического исследования первичная социальная информация требует обработки, без которой серьезный научный анализ результатов исследования может быть затруднен или вовсе невозможен. Именно обработка упорядочивает, группирует и классифицирует большой массив собранных в социологическом исследовании эмпирических данных.
Для успешного проведения обработки информации необходимо соблюдать определенную последовательность. На первой стадии весь массив методического инструментария проходит определенную подготовку. При этом необходимо решить две основные задачи:
1) проверить инструментарий на точность, полноту и качество заполнения. Эти меры предусматривают выявление ошибок в ответах на каждый вопрос и их коррекцию. При проверке анкет, бланков интервью на полноту заполнения проводится выбраковка тех, которые заполнены менее чем на треть. При проверке на качество заполнения контролируется ясность, четкость, адекватность ответов. Все анкеты, бланки интервью и т. Др., Имеющие перечисленные недостатки, исключаются из дальнейшего процесса обработки. Документы, которые остались после контроля, нумеруются, чтобы при последующей их обработке можно было бы проследить за каждым из них;
2) провести кодирования информации, т.е. ее формализацию. Принцип кодирования заключается в переводе содержательной информации на язык формальной логики. Это означает, что кодируется не один смысл ответов, а лишь факт его наличия или отсутствия. Такая форма кодирования достаточна для того, чтобы осуществить числовые операции с любой информацией, независимо от ее первоначального вида, формы, содержания или назначения. Процедура кодирования включает присвоение каждому варианту ответов определенных условных чисел-кодов. В результате вся информация анкет или бланков интервью превращается в систему чисел, в которой решающее значения должен сам порядок кодов (чисел).
Только после завершения кодирования можно переходить непосредственно к обработке информации. Существуют два способа обработки информации — ручной и машинный. Вопрос о способе обработки решается заранее, еще на стадии создания программы и инструментария исследования. Ручная обработка используется при небольшом (до нескольких десятков) количестве анкет. Обработка анкет вручную проходит медленно, часто с ошибками. Лучше социологическую информацию обрабатывать на ЭВМ. Этот процесс следующий после кодирования. Анкеты сортируют, вводят в память машины информацию. Задания для обработки информации составляет исследователь согласно гипотезами исследования и задачами их проверки.
С помощью ЭВМ получают результаты в виде табуляграмм, содержащие социологические данные. Их анализ позволяет исследователю подтвердить или опровергнуть рабочие гипотезы, выявить отклонения или новые явления и тенденции в предмете и объекте изучения.
Обобщение информации происходит в нескольких формах, которые фиксируют разный уровень анализа. Простейшей формой является группировка данных, то есть отнесения респондента к той или иной группе в зависимости от выбранного показателя. Метод группировки позволяет решать следующие типы исследовательских задач: выявление типов социальных явлений; изучение структуры социальных объектов; анализ зависимостей между явлениями.
Сложная структура социальных явлений и процессов, их обусловленность совместным действием совокупности факторов требует многомерной классификации объектов.
Методы многомерной классификации позволяют выявить устойчивые связи социальных явлений, которые рассматриваются в нескольких измерениях одновременно. По сравнению с двухмерным группировкой многомерная классификация — высокий уровень поискового описания и обобщения фактов. Она является средством типологизации социальных объектов.
Различают теоретическую и эмпирическую типологизацию.
Результат социологического исследования определяется тем, насколько исследователь может правильно, глубоко и всесторонне интерпретировать полученные результаты.
Сущность интерпретации данных состоит в структурировании основных понятий, всестороннему объяснению их содержания.
Процедура интерпретации социологических данных должен соответствовать определенным методологическим требованиям: 1) характер оценки и интерпретации должен определиться в общих чертах уже на стадии разработки программы и концепции исследования, где даются принципиальные характеристики изучаемого явления или социального процесса; 2) необходимо максимально полно установить объект и предмет исследования; 3) на всех стадиях анализа следует помнить о многозначности полученных данных, необходимость их интерпретации с разных позиций.
Процедуру интерпретации по содержанию можно охарактеризовать как превращение определенных числовых величин на логическую форму — показатели (индикаторы). В этом процессе исключительно большое значение имеют гипотезы, которые определяются еще на стадии разработки программы исследования. Именно на стадии интерпретации социологических данных они вводятся в работу исследователя. Характер проверки гипотез зависит от типа исследования.
Только после анализа основных взаимодействий, взаимозависимостей между характеристиками объекта исследования следует переходить к формированию основных выводов и разработки практических рекомендаций.
Итог анализа и интерпретации социологических данных приобретает форму документов, которые имеют практическое и теоретическое значение. Эти документы: отчет по итогам исследования, приложение к отчету и аналитическая справка.
Основной документ — отчет по итогам исследования. Его структура соответствует общей логике операционализации основных понятий. Но если при операционализации исследователь в своих рассуждениях шел от абстрактного к конкретному путем дедукции, то при подготовке отчета он придерживается логики индукции, т.е. осуществляет постепенную интеграцию социологических данных в показатели. Такой переход от частного к общему заканчивается ответом на основную гипотезу исследования.
Алгоритмы кластерного анализа позволяют разделить совокупность объектов на однородные по определенным формальным критериям сходства группы (кластеры). Основным свойством этих групп является то, что объекты, которые принадлежат одному кластеру, схожи между собой, чем объекты из разных кластеров. Такую классификацию можно выполнять одновременно по достаточно большим количеством признаков. Например, известно немало статистических показателей, характеризующих уровень социально-экономического развития административных районов страны: население, количество безработных, протяженность шоссейных дорог, количество квадратных метров жилья на одного человека и т.п. Для организации опроса необходимо сгруппировать районы в более крупные образования (регионы), но стоит сделать это так, чтобы в каждом таком регионе были районы, близкие по своим социально-экономическим развитиям. Это позволит выбрать в таком регионе один типичный район и результаты опроса в нем обобщить относительно всего региона. Такая группировка может быть эффективно проведено методом кластерного анализа, поскольку в данном случае учитывается и обобщается большое количество показателей.
Итог анализа и интерпретации социологических данных приобретает формы документов: отчета по результатам исследования, информационной или аналитической справки. Они содержат сведения, выводы и рекомендации для принятия практических (управленческих) решений. В научно-исследовательском плане — это банк социологических данных научного анализа.
Заключение
Обработка собранных данных — важный этап эмпирического исследования. От того, как решен вопрос обработки информации, в значительной степени зависят сроки, стоимость и вообще успех исследования. Ответ на него должен быть найден к тиражированию анкеты, поскольку от программного обеспечения, которое будет использоваться для обработки материала, зависит кодирования анкеты.
До начала сбора информации желательно определиться, какие методы анализа данных будут применяться (построение таблиц определенного вида, факторный анализ и т.д.), а также какие конкретно признаки анализироваться с помощью того или иного метода. Понятно, что такой план может быть только приблизительным, поскольку анализ данных — итерационный процесс, развитие которого происходит в диалоге (непосредственном или заочном) с компьютером. План нужен для того, чтобы подобрать необходимое программное обеспечение, а также как начальный этап анализа.
Собранную информацию обрабатывают или вручную, или с помощью компьютера. Ручные методы обработки информации применяются (и теперь довольно редко и преимущественно в случае, если социолог не имеет возможности работать на компьютере, а надо обработать небольшой по объему (до 50 единиц) массив анкет с незначительным (от 10 до 20) количеством вопросов. Это могут быть, например, данные пилотажного исследования или данные экспертного опроса. При проведении вычислений при ручной обработке данных широко используют калькуляторы.
Для обработки больших массивов, содержащих данные о тысяче объектов, описываемых несколькими сотнями признаков, следует применять вычислительную технику, имеет достаточный объем памяти и высокую скорость вычислений.
Список использованной литературы
- Волков Ю. Г. Социология: лекции и задачи. — М., 2003.
- Кравченко А. И. Социология: учебник. — М., 2003.
- Мертон Р. Социальная теория и социальная структура. — К., 1996.
- Рысь Ю. И., Степанов В. Е. Социология: Структурно-логические схемы с комментариями. — М., 2009.
- Смелзер Н. Социология / Пер. с англ. — М., 2004.
- Социология / Казаринова Н. В., Филатова О. Г., Хренов А. Е. — М., 2000.