Здавалка
Главная | Обратная связь

Обработка полученных данных, анализ и интерпретация результатов (общий обзор)



В самом начале работы над неупорядоченным массивом исходной информации находится группировка материала, т. е. распределение изучаемых единиц на однородные группы по каким-либо признакам (полу, возрасту и т. д.). Результатом этого действия становятся статистические ряды (неупорядоченные или ранжированные). Признаки, положенные в их основу, могут приобретать различные значения (варианты), в результате чего получается вариационный ряд для наблюдаемого признака.

Следующий этап – расчет средних значений признака и степени его колеблемости. В статистике существует несколько понятий: средняя арифметическая (простая и взвешенная), средняя гармоническая, мода и медиана; для определения колеблемости (вариации) значений признака делаются расчеты дисперсии, среднего квадратического и среднего линейного отклонения, а также коэффициента вариации. Считается, что при вычислении средних обобщающих показателей выявляются общие для данной совокупности типические размеры уровня того или иного признака и тем самым выявляются некоторые общие для нее типические черты и свойства.

Кроме вышеперечисленных расчетов, связанных с дескриптивной функцией статистики, существуют еще понятия, процедуры и принципы статистического вывода. Они связаны с изучением характера и особенностей распределения наблюдаемого признака, а также проверкой статистических гипотез. Понятие «статистическая гипотеза» – более узкое, чем «научная гипотеза» и относится к предположениям относительно вида или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты наблюдений в случайной выборке.

Построение графиков и таблиц при обработке данных. На базе вариационных рядов в ходе обработки данных готовятся их графические изображения. В зависимости от характера вариационного ряда строятся и различные виды графиков.

Гистограмма – графическое изображение интервального вариационного ряда. При ее построении по горизонтальной оси откладываются границы интервалов, а по вертикальной – соответствующие частоты.

Полигон распределения используется для изображения дискретного вариационного ряда. В этом случае по горизонтали откладываются величины признака (варианты), а по вертикали – соответствующие частоты.

Кумулята – это кривая накопленных частот; она применима и к дискретному, и к интервальному вариационным рядам. В первом случае на оси абсцисс откладываются значения дискретного признака, а во втором – границы интервалов; и в том, и в другом случаях по оси ординат откладываются накопленные частоты.

Осуществляемая на первой стадии обработки данных группировка материала обычно представляется в виде статистических таблиц.

Построение таблиц подчинено определенным правилам. Основное содержание таблицы должно быть отражено в названии (круг рассматриваемых вопросов, географические границы статистической совокупности, время, единицы измерения). Простые таблицы представляют собой перечень, список отдельных единиц совокупности с количественной (или качественной) характеристикой каждой из них в отдельности. В групповых таблицах содержится группировка единиц совокупности по одному признаку, а в комбинированных – по двум и более признакам.

Именно группировка материала и представление его в виде статистических таблиц облегчают (даже чисто визуально) переход к более сложным методам математико-статистического анализа.

Основные понятия математической статистики. К основным понятиям математической статистики относят частоту, вероятность и распределение. Кроме того, фундаментальным понятием математической статистики является понятие группы, или совокупности, которое обычно определяется как генеральная совокупность. Генеральная совокупность – это совокупность, множество элементов, обладающих каким-то одним или многими признаками. Признак является переменной величиной для каждого элемента генеральной совокупности и называется вариантой.

Частотами называются числа, показывающие сколько раз (как часто) встречается данная варианта во всей совокупности.

Вероятность в самом общем понимании – это степень возможности появления различных случайных событий. Теория вероятностей, как раздел «чистой математики, является основой для математической статистики – разделу прикладной математики. В математической статистике понятию вероятность соответствует понятие относительная частота. Для ее определения нужно определить абсолютную частоту появления данного события и долю его в общем количестве имевших место событий.

Закон распределения вероятностей случайной величины – соответствие между возможными значениями случайной величины и их вероятностями. Различают теоретические и эмпирические вероятностные распределения; одно из наиболее используемых видов теоретического распределения называется нормальным.

Нормальное распределение наблюдается в тех случаях, когда изменения признака вызываются множеством независимых друг от друга (или слабо зависимых) факторов, каждый из которых играет в общей сумме примерно одинаковую и малую роль, т. е. отсутствуют доминирующие факторы.

Многомерный статистический анализ. Методы многомерной статистики применяются в социологии на том основании, что изучаемые социальные явления обладают большой сложностью и многофакторностью связей между ними, причем характер этих связей – самый разнообразный.

Для выявления причинно-следственных связей используются методы корреляционного и регрессионного анализа. Они служат для установления связи между двумя и более числом факторов (переменных).

Функциональная связь означает, что с изменением одного признака другой признак меняется на строго определенную величину. Корреляционная связь имеет вероятностный характер. После расчета коэффициента корреляции и оценки его достоверности можно сказать, доказана ли связь между признаками или же она не существенна.

Уравнение регрессии дает представление о связи. Линейная связь означает, что измерение одного признака вызывает изменение другого на строго определенную величину. Нелинейная связь отмечает сначала увеличение, а затем уменьшение другого признака, хотя первый увеличивается или уменьшается на строго определенную величину.

Факторный анализ осуществляется на основе рассчитанных коэффициентов корреляции, что позволяет из множества факторов выделить наиболее влиятельный и существенный.

Дисперсионный анализ способствует поиску причинно-следственных связей; он показывает долю влияния определенного фактора на изучаемый признак.

Применение корреляционного и регрессионного видов анализа предполагает:

· наличие количественных показателей;

· нормально распределенную совокупность;

· линейную зависимость показателей.

Трудности в построении шкал являются причиной того, что вместо коэффициентов корреляции делают расчеты коэффициентов связи, несопоставимые с корреляционными коэффициентами. Регрессионный анализ при этом невозможен.

Обработка данных с помощью компьютерной техники. В связи с тем, что работа с компьютером выходит за рамки этого курса, в данном вопросе хотелось бы ограничиться процедурным рассмотрением двух этапов: подготовки информации для обработки на ЭВМ и самого процесса обработки информации.

Первый из названных этапов идет в следующем порядке:

· формирование рабочих (под) массивов;

· проверка качества вводимой информации;

· нумерация (под) массивов и документов;

· «закрытие» открытых вопросов анкеты;

· расчет (вне ЭВМ) контрольных чисел;

· выбор системы кодирования;

· разработка макета ввода данных (если это не было сделано еще на подготовительном этапе исследования).

Второй этап проходит в такой последовательности:

· описание структуры вводимой информации;

· подготовка задания на обработку (если это не было сделано еще на подготовительном этапе исследования);

· ввод информации и формирование информационного массива;

· расчет распределений и контрольных чисел;

· решение основных математико-статистических задач;

· анализ и устранение ошибок;

· передача материалов для дальнейшего (содержательного) анализа;

· архивирование и хранение материалов.

Типология методов анализа данных.Анализ данных представляет собой совокупность действий, осуществляемых исследователем в процессе изучения полученных тем или иным образом данных с целью формирования определенных представлений о характере явления или процесса, описываемого этими данными.

Выбор одного или нескольких (из множества) методов (видов, форм, приемов) анализа предопределяется характером исследовательских гипотез, природой полученных данных, требованиями к «конечному» исследовательскому результату, а также позицией и потенциалом самого исследователя.

Существует несколько подходов к «упорядочению» (типологии, классификации) методов анализа данных в социологии. Так, Р. Пэнто и М. Гравитц говорят об отдельных уровнях, которые наиболее часто встречаются в социальных науках и отличаются друг от друга глубиной поставленной цели. Это – описание, классификация, иногда называемая идентификацией, и объяснение.

В.А. Ядов выделяет два класса процедур анализа. К первому он относит дескриптивные процедуры: группировку (простую и перекрестную), классификацию и типологизацию (эмпирическую и теоретическую). Ко второму классу причисляются аналитико-экспериментальные процедуры, устанавливающие связи взаимодействия и детерминации (интерпретация, реальный и мысленный эксперимент и т. д.).

Этот же автор дает описание последовательности действий (стадий) при анализе данных:

· описание всей совокупности данных в их простейшей форме;

· «уплотнение» исходной информации (укрупнение шкал, построение индексов и т. п.);

· углубление интерпретации и переход к объяснению факторов (например, выявление прямых или косвенных факторов);

· попытка прогноза развития изучаемого процесса, событий, явлений при определенных условиях.

Бывает трудно, а порой и нецелесообразно разделять понятия (этапы) обработки и анализа данных. И, тем не менее, такое разделение существует. За эмпирическим обследованием и статистической обработкой данных следует еще один решающий этап исследовательского процесса – теоретическая обработка эмпирических данных. Считается при этом, что из эмпирических данных получаются эмпирические знания, и только после их теоретической обработки – знания теоретические.

Существует одна, довольно-таки парадоксальная точка зрения. Поскольку обработанные данные представляют собой усредненные величины, имеющие довольно общий характер и часто сочетающие в себе весьма разнородные элементы исследуемого объекта, в результате практически невозможна однозначная интерпретация социологических данных, а, следовательно, и формулировка соответствующих выводов и рекомендаций. Вряд ли приведенное высказывание – аргумент в пользу социологического агностицизма. Это – нормальный научный скепсис, если не осознаваемый, то подразумеваемый.

Описание и объяснение в социологии. Описание и объяснение – два уровня отражения реального (возможно, и не только реального, если таковой существует) мира как в науке, так даже и в обыденном сознании. Нельзя однозначно утверждать, что описание – это «арифметика», а объяснение – «алгебра» социального познания: каждое из них имеет свои цели, задачи, принципы и правила.

Описание и объяснение – взаимосвязанные функции социального познания, осуществляемые на эмпирическом и теоретическом его уровнях.

Описание представляет собой фиксацию результатов эмпирического исследования в соответствующих терминах. В процессе описания данные наблюдения, эксперимента, измерения подвергаются определенному уплотнению, сжатию, упорядочению, в результате чего они подготавливаются к последующему описанию, которое ограничивается перечислением некоторых свойств объектов, группировкой по их внешним признакам, установлением наблюдаемых зависимостей. Внутренняя логика развития познания в целом предполагает переход от описания к объяснению, хотя в социальном познании это происходит не во всех случаях.

Объяснение – это процесс раскрытия сущности объектов, охватывающий их структурные, функциональные, генетические, причинно-следственные связи и отношения, тенденции развития, которые отображаются в гипотезах, законах, теориях.

В методологической литературе принято различать дедуктивное и индуктивное объяснение; в зависимости от объясняющих положений – объяснение факта, закона или теории; в зависимости от характера объясняемых положений – причинное, функциональное, структурное и телеологическое виды объяснений.

Объяснение социологических фактов происходит либо через собственный (социологический) закон, либо через модельное построение – и в этом объяснения различаются уже по характеру их механизма.

Типология и классификация. Уникальность каждого отдельного человека – еще не основание считать, что невозможно выделение социальных общностей (социальных групп), которым присущи одинаковые либо сходные признаки – достаточно назвать такие – пол, возраст, уровень образования, место проживания. Возможно, на базе этой посылки и существуют в сфере обработки такие понятия (методы, процедуры), как типология и классификация. Обратимся к определениям.

Под типологией обычно понимается метод научного познания, в основе которого лежит обладающее определенными свойствами разбиение изучаемой совокупности объектов на группы. Для большей четкости изложения будем использовать термин «типологизация» для обозначения процесса разбиения, оставив термин «типология» для обозначения его результатов.

Принято различать понятия эмпирической и теоретической типологии. Эмпирическая типология – поиск устойчивых сочетаний свойств социальных объектов (или явлений), рассматриваемых в соответствии с описательными гипотезами в нескольких измерениях одновременно. Теоретическая типология представляет собой обобщение признаков социальных явлений на основе идеальной теоретической модели и по теоретически обоснованным критериям.

Считается, что если типология тесно связана с содержательным характером разбиения совокупности на группы, с определенным уровнем познания, то классификация подобными свойствами не обладает, и в нее не вкладывают гносеологического смысла. К методам классификации относят любые формальные методы, с помощью которых можно определить, принадлежит или не принадлежит объект к тому или иному классу.

В теории и практике социологических исследований (и в соответствующей научной литературе) встречаются множество терминов (хотя единая терминология в данном вопросе еще не отработана) относящихся к разделению объектов на группы: классификация, типология, группировка, систематизация, таксономия и т. д.

Количественный и качественный анализ. Можно, конечно, на уровне обыденного сознания и здравого смысла все «цифровые» методы отнести к количественному анализу, а «словесно-смысловые» – к качественному. Но такое разделение не является строго научным.

Существует достаточно разработанное и детальное описание и количественных (статистических), и качественных (содержательных) методов анализа данных.

В количественном анализе выделяют:

· методы описательной статистики (средние величины, меры вариации, многомерные распределения);

· методы статистики вывода, куда причисляют корреляционный, регрессионный, факторный, кластерный, причинный, логлинейный, дисперсионный и другие виды анализа, а также многомерное шкалирование.

Качественный анализ – характер осуществления социологического исследования и изложения его результатов, при котором основной акцент делается на теоретических ресурсах социологии, индивидуальном опыте, наблюдении и интуиции, традиционных средствах философского и логического анализа категорий и понятий, исторических сопоставлениях, использовании отдельных личных и официальных документов, приемов публицистического и художественного обоснования утверждений, выводов и рекомендаций.

Здесь может сложиться вполне обоснованное предположение, что количественный анализ – это следование правилам и формулам, а анализ качественный – это поиск, творчество и фантазия.

Возможно, это и так. Однако даже такое предположение не отрицает того факта, что любые применяемые средства, методы и процедуры «переводят» язык цифр (после компьютерной обработки данных) и слов (мнения респондентов, текстовые документальные материалы) на язык научных обобщений и обоснований.

В этом – единство количественных и качественных методов анализа в социологическом исследовании.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.