Зависимость объема выборки от коэффициента вариации
Если изучаются условия труда, взаимоотношения в коллективе, заработная плата и т. д. с помощью пятичленной шкалы, то коэффициент вариации изменяется здесь от 27 до 62%. Для расчета объема выборки в количественном исследовании чаще всего используют два статистических понятия – доверительный интервал и доверительную вероятность. Доверительный интервал представляет собой заранее задаваемую вами погрешность выборки. Например, если вы задаете доверительный интервал в 3% и конкретный ответ на конкретный вопрос исследования составит 48%, это значит, что даже при проведении опроса всей генеральной совокупности реальное значение попадет в интервал между 45 (48 - 3) и 51 % (48 + 3). Доверительная вероятность показывает, насколько вы можете быть уверены в полученных результатах, в том, что характеристики выборки соответствуют характеристикам всей генеральной совокупности – иными словами, с какой вероятностью случайный ответ попадет в доверительный интервал. Обычно используют доверительную вероятность 95 и 99%. Чаще всего используется 95% – этого вполне достаточно в подавляющем большинстве исследований. Весьма полезна следующая приблизительная оценка надежности результатов выборочного обследования. Повышенная надежность допускает ошибку выборки до 3%, обыкновенная – от 3 до 10% (доверительный интервал распределений на уровне 0,03-0,1), приближенная – от 10 до 20%, ориентировочная – от 20 до 40%, а прикидочная – более 40%. Процедуры построения выборки можно рассмотреть на конкретном примере многоступенчатого отбора «вуз – факультет – курс – группа – студент». Он проходит в такой последовательности: · территория делится на несколько относительно однородных по уровню развития и территориальной близости групп областей; · все вузы группируются по их специализации (педагогические, технические и т.д.); · проводится предварительный расчет объема выборки (количество вузов и студентов в них); · в выборочной совокупности вузов отбираются типичные для них факультеты, курсы и группы. Нельзя забывать, что работа по формированию выборки не заканчивается с построением ее модели. Реализация этой модели может столкнуться с феноменом смещения выборки, и тогда возникает потребность в ее корректировке. Это важная и необходимая процедура в формировании выборки, но уже апостериори. Даже полные знания о параметрах генеральной совокупности и строгое соблюдение всех намеченных процедур выборочного исследования не смогут обеспечить полную идентичность выборочной и генеральной совокупностей по изучаемым признакам. Ошибка выборки – отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности. На практике ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов. В качестве контрольных параметров обычно применяются социально-демографические признаки. Сравнение средних генеральной и выборочной совокупностей, на основе этого определение ошибки выборки и ее уменьшение называется контролированием репрезентативности. Поскольку сравнение своих и чужих данных можно сделать по завершении исследования, такой способ контроля называется апостериорным, т.е. осуществляемым после опыта. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Ошибки выборки подразделяются на два типа – случайные и систематические. Случайная ошибка – это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погрешности, присущие самому выборочному методу. Они поддаются учету, контролю, корректировке и уменьшаются при возрастании объема выборочной совокупности. Второй тип ошибок выборки – систематические ошибки. Например, социолог решил узнать мнение всех жителей города о проводимой муниципальными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка. Основные источники появления систематических ошибок: · несоответствие выборки задачам исследования; · неполнота знаний о характере генеральной совокупности; · некорректный выбор процедур сбора информации; · отбор наиболее «удобных» (по разным причинам) единиц. В отличие от случайных ошибок систематические ошибки при возрастании объема выборки не уменьшаются. Систематические ошибки легче предупредить (по сравнению со случайными), но их очень трудно устранить. Предупреждать систематические ошибки, точно предвидя их источники, лучше всего заранее – в самом начале исследования. Вот некоторые способы избежать ошибок: · каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку; · отбор желательно производить из однородных совокупностей; · надо знать характеристики генеральной совокупности; · при составлении выборочной совокупности надо учитывать случайные и систематические ошибки. Кроме вышеперечисленных, выделяются ошибки преднамеренные и непреднамеренные, фактические и теоретические. Поскольку в понятие «ошибка выборки» заложена соотнесенность распределений изучаемых признаков в выборочной и генеральной совокупностях, расчет ошибок производится с использованием понятий и формул математической статистики (вариация, дисперсия и т.д.). Доказывается, что при случайной выборке ошибка равна квадратному корню из дисперсии признака в генеральной совокупности, деленной на объем выборки. Существуют несколько формул расчета ошибок репрезентативности для различных видов выборки (случайной, районированной серийной, с которыми можно познакомиться в специальной литературе. Контроль и ремонт выборки. Качество социологической информации может снизить множество факторов: неправильно сформулированные анкетные вопросы, неверно выбранный метод исследования, пропущенные ответы в анкетах, нечетко спланированная выборка и др. Контролем выборки называют процесс научного сравнения генеральной и выборочной совокупностей, выявление степени их расхождения, обнаружение причин отклонения и разработку возможных способов устранения погрешностей. В узком смысле – это уравнивание выборочных и генеральных распределений социально-демографических характеристик респондентов. Под ремонтом выборки понимают сам процесс устранения погрешностей, т.е. расхождения двух совокупностей, теми способами, методами и инструментами, которые предлагает методическая наука. Таким образом, второй прием выступает практической реализацией первого, аналитического, а оба они составляют два обязательных этапа проведения социологического исследования. Основная цель ремонта выборки – повышение качества уже собранной информации. Процедура ремонта выборки включает несколько операций. Коррекция выборочной совокупности. Далеко не всегда отобранные респонденты, по самым разным обстоятельствам, могут или желают отвечать на вопросы. Кто-то заболел или уехал в срочную командировку, другой отказывается по идейным соображениям или не способен отвечать в силу умственной недостаточности. Кого-то трудно застать дома, хотя анкетер приходил к нему не единожды. Возникает проблема замены респондентов, которая может быть решена с помощью нескольких методов: выбор следующего по списку респондента (например, следующего номера в телефонном справочнике), использование первоначальной выборки больших размеров и формирование повторной выборки. В последнем случае, если процент ответов оказался намного ниже, чем ожидалось, основа выборки расширяется за счет дополнительных имен, найденных, например, случайным образом. Самым эффективным способом считается поиск эквивалентной замены. Если, к примеру, в вашу выборку попал работающий пенсионер такой-то национальности и овдовевший, то желательно подыскать ему в качестве замены другого пенсионера сходного возраста, национальности, овдовевшего и работающего. Нередко подобный способ превращается в трудо- и времязатратное мероприятие. Если список генеральной совокупности невелик и найти замену не удается, следует отказаться от эквивалентного метода и перейти к другому. Коррекция распределений демографических характеристик респондентов. Применяют три основных способа: · удаление тех групп респондентов, которые оказались представлены в избыточном количестве; · доопрос групп, которые оказались представленными в недостаточном количестве; · математическое повышение значения ответов, представленных недостаточно, или снижение – представленных избыточно. Взвешивание исходных данных – математический способ повышения или понижения значения ответов конкретной группы респондентов (например, незамужних сельских женщин в возрасте от 30 до 45 лет). Взвешивание означает присваивание каждому респонденту определенного веса (коэффициента, на который нужно умножить все мнения-ответы одного или группы респондентов ради восстановления репрезентативности). Коррекция резко выделяющихся ответов респондентов. При опросе иногда попадаются такие ответы респондентов, которые резко выделяются на общем фоне. Причины могут быть самые разные: респондент неправильно понял вопрос анкеты, у него оригинальные взгляды на мир или попросту решил подшутить над учеными. Могут быть и другие причины. Но вернуться к нему и переспросить уже нельзя. В таком случае, особенно если анкет много, бракованный экземпляр лучше удалить из общего массива. Коррекция пропущенных ответов. Пропуски чаще всего возникают в открытых и табличных вопросах. Самый простой способ коррекции – исключить их или всю анкету из научного анализа. При пропуске не содержательного вопроса, а того, что имеется в паспортичке, поступают так. Если социально-демографические характеристики не связаны с содержательными ответами, то анкете с пропущенными значениями следует присвоить наиболее часто встречающиеся в выборке социально-демографические характеристики либо определить их случайным образом или пропорционально (если таких анкет много). Если же связь есть, то следует определить, к ответам какой группы (например, мужчин или женщин) ближе ответы в анкете, где графа «пол» не указана, и внести этот признак. Если данных получено много, то ремонт выборки может осуществляться за счет сокращения выборочной совокупности. Это наиболее рациональный подход к ремонту выборки, поскольку данная стратегия не опирается ни на какие дополнительные допущения. Переформирование выборки осуществляется тогда, когда проверка показала, что выборка не представляет совокупность в целом. В этом случае выбираются новые респонденты, и они добавляются к ранее использованной выборке, пока не будет достигнут удовлетворительный уровень репрезентативности. Репрезентативность выборочных исследований.Репрезентативность (франц. representatif – показательный) – свойство выборочной совокупности представлять характеристики генеральной совокупности. Требования репрезентативности выборки означают, что по выделенным параметрам (критериям) состав обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности. Признается, что степень подобия выборки параметрам генеральной совокупности определяется ошибкой выборки. Достижение репрезентативности предполагает: равные для всех единиц отбора возможности попасть в выборку; независимый от изучаемого признака выбор единиц; наличие однородных совокупностей для последующего отбора; необходим достаточный объем выборки. Процесс непосредственного определения репрезентативности выборки складывается из этапов: сопоставление средних показателей распределений выборочной и генеральной совокупностей; сопоставление форм распределения этих показателей. Средний показатель распределения обычно берется как средняя арифметическая или средневзвешенная арифметическая этого распределения. В случае изучения совокупностей с альтернативными признаками вместо средней арифметической вычисляется доля единиц, обладающих рассматриваемой характеристикой, относительно всей совокупности. Если обозначить объем совокупности символом N, а явление с данным признаком – М, то Р – доля явлений с этим признаком определяется: Р=М/N P+Q=1(100%) 1-P=Q, где Q – доля явлений с альтернативным признаком. Пользоваться выводами, полученными на основании исследования выборочной совокупности, можно в том случае, если разность между средними арифметическими (или средними долями) признаков выборочной и генеральной совокупностей стремится к нулю. Предполагается, что это требование удовлетворяется при выполнении четырех условий, оговоренных выше. Правда, зная только выборочные средние показатели, нельзя дать точные оценки их разности, так как неизвестны средние показатели генеральной совокупности. Кроме того, сами значения выборочных средних могут колебаться в зависимости от того, какие единицы генеральной совокупности попадут в выборку. Поэтому оценка репрезентативности выборочной совокупности по средним показателям ее распределения сводится к поиску ошибки репрезентативности. Обычно число положительных отклонений от среднего арифметического значения совокупности примерно равно числу отрицательных отклонений, т.е. сумма всех отклонений неизбежно стремится к нулевому значению. Поэтому, если бы потребовалось просуммировать все отклонения признака в совокупности, эта сумма всегда была бы равна нулю. Во избежание этого каждое отклонение возводят в квадрат и находят сумму квадратов – дисперсию. Нормальное распределение в полной мере характеризуется параметрами: х – среднее значение признака и σ – среднее квадратичное (стандартное) отклонение. Основная же проблема репрезентативности – в правомерности экстраполяции выводов, полученных при анализе выборочной совокупности, на всю генеральную совокупность. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Такое распространение результатов в зарубежной литературе называют генерализуемостью. Репрезентативным считается исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5%.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|