Вариация признака в совокупности и значение её изучения
Основой обработки данных статистического наблюдения является построение рядов распределения. Цель его - выявление основных свойств и закономерностей исследуемой статистической совокупности. В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают соответственно два типа рядов распределения - атрибутивные и вариационные. Ряды распределения, построенные по качественным признакам, называют атрибутивными. Примером атрибутивных рядов может служить распределение населения по полу, характеру труда, национальности, профессии и т.д. Ряды распределения, построенные по количественному признаку, называют вариационными. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие в величине признака носит название вариации. Рассмотрим пример: Таблица 13.4 Динамика цен 1 кв. м. муниципального жилья в Москве в 1995 г. (млн.руб.)
Числовые значения признака, встречающиеся в данной совокупности, называют вариантами значений. В данном примере встречается пять вариантов значений признака, которые колеблются в пределах от 4,9 до 7,6 млн. руб. за 1 кв. м. Изучение характера и степени вариации признаков у отдельных единиц, составляющих изучаемую совокупность, является важнейшим вопросом всякого статистического исследования. Управление процессом развития в желаемом направлении требует определения роли не только каждой из выше названных групп факторов в вариации тех или иных признаков, но и роли отдельных факторов соответствующих групп. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которой измеряется вариация. Представленные выше данные о цене 1 кв. м. муниципального жилья по шести районам г. Москвы без какой-либо систематизации образуют так называемый первичный ряд данных. При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по величине признака в совокупности. Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов ряда в возрастающем (или убывающем) порядке. В мае 1995 г. по районам Москвы мы располагали такой информацией о цене 1 кв. м. муниципального жилья: Таблица 25.1
Ранжированный ряд данных позволяет сразу увидеть наименьшее и наибольшее значение признака в совокупности, определить расстояние между крайними значениями признака, а также выделить наиболее часто повторяющиеся значения в обследуемой совокупности. Использование ранжированного ряда также позволяет легко разделить все данные по группам. В нашем примере цена 1 кв. м. жилья варьирует по районам г. Москвы от 4,9 млн. до 7,6 млн. руб., т.е. размах вариации составляет 2,7 млн. руб. за 1 кв. м, можно также видеть, что в двух районах встречается одна и та же цена - 4,9 млн. руб. По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, т.е. даны в виде прерывных чисел. Например, тарифный разряд рабочих, число детей в семье, число рабочих на предприятии и т.д. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определенных границах принимать любые значения. Например, заработная плата рабочих, размер среднедушевого денежного дохода, стоимость основных фондов предприятия и т.д. Способы построения вариационного ряда для этих видов признаков различны. Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся варианты значений признака, обозначаемые через , а затем подсчитать частоту повторения каждого варианта (например, распределение рабочих по разрядам, студентов по успеваемости и т.п.). В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения признака у отдельных единиц могут вообще не повторяться, строятся интервальные ряды распределения. Интервал указывает определенные пределы значений варьирующего признака и обозначается нижней и верхней границами интервала. Такие распределения наиболее распространены в практике статистической работы. При построении интервальных рядов распределения необходимо прежде всего установить число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности. При группировке внутри однородных совокупностей появляется возможность применения равных интервалов, величина которых зависит от вариации признака в совокупности и от количества обследованных единиц. Определение величины интервала для построения вариационного ряда с равными интервалами производится следующим образом: 1) вычисляется разность между максимальным и минималь- 2) размах вариации делится на число групп , т.е. Число групп приближенно определяется по формуле Стэрджесса: где общее число изучаемых единиц совокупности. Указанное выражение почти всегда оказывается дробной величиной, которую округляют до целого числа, поскольку количество групп не может быть дробным. Для целей анализа и сравнительной характеристики различных рядов распределения применяются обобщающие показатели вариационного ряда. Система таких показателей может быть наглядно представлена при сравнении особенностей нескольких рядов распределения. 1. Выборочное среднее , где измеренная величина, количество измеренных значений. Выборочное среднее характеризует среднее значение экспериментального показателя в выборке наблюдений. Этот показатель очень часто используется при сравнении различных выборок наблюдений. Пусть в результате эксперимента получена выборка значений: Рассчитаем ее выборочное среднее 2. Выборочная дисперсия Выборочная дисперсия характеризует меру рассеяния случайной величины относительно математического ожидания (выборочного среднего значения). Выборочная дисперсия в условиях предыдущего примера рассчитывается как 3. Выборочная медиана Выборочная медиана представляет собой то значение в вариационном ряду, которое делит его пополам. Например, в вариационном ряду всего 21 измерение, поэтому значение 11-го измерения и будет значением медианы. Этот показатель очень часто используется в психологических исследованиях. 4. Асимметрия Если , то эмпирическое распределение несимметрично и сдвинуто вправо. При распределение имеет сдвиг влево. При распределение симметрично. 5. Эксцесс Е. Показатель, характеризующий выпуклость или вогнутость эмпирических распределений: Если больше или равно нулю, распределение выпукло, в других случаях - вогнуто. 6. Мода наибольшая частота, в примере Квантиль Это значение вариационного ряда, которое соответствует заданному значению вероятности появления признака. При это значение называется нижним квартилем, при верхним квартилем. Например, в выборке из 13 значений нижний квартиль равен 13, верхний – 25, а мода 21. Пример
8. Размах выборки В примере ©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|