Здавалка
Главная | Обратная связь

Вариация признака в совокупности и значение её изучения



Основой обработки данных статистическо­го наблюдения является построение рядов распределения. Цель его - выявление основных свойств и закономерностей исследуе­мой статистической совокупности. В зависимости от того, явля­ется ли признак, взятый за основу группировки, качественным или количественным, различают соответственно два типа рядов распределения - атрибутивные и вариационные. Ряды распреде­ления, построенные по качественным признакам, называют ат­рибутивными. Примером атрибутивных рядов может служить распределение населения по полу, характеру труда, националь­ности, профессии и т.д. Ряды распределения, построенные по ко­личественному признаку, называют вариационными. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие в величине признака носит название вариации.

Рассмотрим пример:

Таблица 13.4

Динамика цен 1 кв. м. муниципального жилья в Москве в 1995 г. (млн.руб.)

 

Местоположение жилья Май
Митино 5,2
Южное Бутово 4,9
Северное Бутово 5,8
Отрадное 6,5
Веерная улица 7,6
Жулебино 4,9

Числовые значения признака, встречающиеся в данной сово­купности, называют вариантами значений. В данном примере встречается пять вариантов значений признака, которые колеб­лются в пределах от 4,9 до 7,6 млн. руб. за 1 кв. м.

Изучение характера и степени вариации признаков у отдель­ных единиц, составляющих изучаемую совокупность, является важнейшим вопросом всякого статистического исследования. Управление процессом развития в желаемом направлении тре­бует определения роли не только каждой из выше названных групп факторов в вариации тех или иных признаков, но и роли отдельных факторов соответствующих групп. Для решения та­кой задачи в статистике применяются специальные методы ис­следования вариации, основанные на использовании системы по­казателей, с помощью которой измеряется вариация.

Представленные выше данные о цене 1 кв. м. муниципаль­ного жилья по шести районам г. Москвы без какой-либо си­стематизации образуют так называемый первичный ряд дан­ных. При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозри­мым и непосредственное рассмотрение его не дает представле­ния о распределении единиц по величине признака в совокупности. Первым шагом в упорядочении первичного ряда явля­ется его ранжирование, т.е. расположение всех вариантов ряда в возрастающем (или убывающем) порядке. В мае 1995 г. по районам Москвы мы располагали такой информацией о цене 1 кв. м. муниципального жилья:

Таблица 25.1

 

Район Москвы Южное Бутово Жулебино Митино Север­ное Бутотово Отрад­ное Веерная улица
Цена 1 кв. м. жилья, млн. руб. 4,9 4,9 5.2 5,8 6,5 7,6

 

Ранжированный ряд данных позволяет сразу увидеть наи­меньшее и наибольшее значение признака в совокупности, опре­делить расстояние между крайними значениями признака, а так­же выделить наиболее часто повторяющиеся значения в обсле­дуемой совокупности. Использование ранжированного ряда так­же позволяет легко разделить все данные по группам. В нашем примере цена 1 кв. м. жилья варьирует по районам г. Москвы от 4,9 млн. до 7,6 млн. руб., т.е. размах вариации составляет 2,7 млн. руб. за 1 кв. м, можно также видеть, что в двух районах встречает­ся одна и та же цена - 4,9 млн. руб.

По характеру вариации различают дискретные и непрерыв­ные признаки. Дискретные признаки отличаются друг от дру­га на некоторую конечную величину, т.е. даны в виде прерыв­ных чисел. Например, тарифный разряд рабочих, число детей в семье, число рабочих на предприятии и т.д. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определенных границах принимать лю­бые значения. Например, заработная плата рабочих, размер среднедушевого денежного дохода, стоимость основных фон­дов предприятия и т.д.

Способы построения вариационного ряда для этих видов при­знаков различны. Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся ва­рианты значений признака, обозначаемые через , а затем под­считать частоту повторения каждого варианта (например, рас­пределение рабочих по разрядам, студентов по успеваемости и т.п.).

В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения признака у отдельных единиц могут во­обще не повторяться, строятся интервальные ряды распределе­ния. Интервал указывает определенные пределы значений варь­ирующего признака и обозначается нижней и верхней граница­ми интервала. Такие распределения наиболее распространены в практике статистической работы.

При построении интервальных рядов распределения необхо­димо прежде всего установить число групп (интервалов), на ко­торые следует разбить все единицы изучаемой совокупности. При группировке внутри однородных совокупностей появляется воз­можность применения равных интервалов, величина которых за­висит от вариации признака в совокупности и от количества об­следованных единиц.

Определение величины интервала для построения вариаци­онного ряда с равными интервалами производится следующим образом:

1) вычисляется разность между максимальным и минималь-­
ным значениями признака первичного ряда (определяется раз-­
мах вариации, ):

2) размах вариации делится на число групп , т.е.

Число групп приближенно определяется по формуле Стэрджесса: где общее число изучаемых единиц сово­купности.

Указанное выражение почти всегда оказывается дробной ве­личиной, которую округляют до целого числа, поскольку коли­чество групп не может быть дробным.

Для целей анализа и сравнительной характеристики различ­ных рядов распределения применяются обобщающие показате­ли вариационного ряда. Система таких показателей может быть наглядно представлена при сравнении особенностей нескольких рядов распределения.

1. Выборочное среднее ,

где измеренная величина, количество измеренных значений.

Выборочное среднее характеризует среднее значение экспериментального пока­зателя в выборке наблюдений. Этот показатель очень часто используется при сравнении различных выборок наблюдений. Пусть в результате эксперимента получена выборка значений: Рассчитаем ее выборочное среднее

2. Выборочная дисперсия

Выборочная дисперсия характеризует меру рассеяния случайной величины относительно математического ожидания (выборочного среднего значения). Выборочная дисперсия в условиях предыдущего примера рассчитывается как

3. Выборочная медиана

Выборочная медиана представляет собой то значение в вариационном ряду, которое делит его пополам. Например, в вариационном ряду всего 21 измерение, поэтому значение 11-го измерения и будет значением медианы. Этот показатель очень часто используется в психологических исследованиях.

4. Асимметрия

Если , то эмпирическое распределение несимметрично и сдвинуто вправо. При распределение имеет сдвиг влево. При распределение симмет­рично.

5. Эксцесс Е. Показатель, характеризующий выпуклость или вогнутость эмпирических распределений:

Если больше или равно нулю, распределение выпукло, в других слу­чаях - вогнуто.

6. Мода наибольшая частота, в примере

Квантиль

Это значение вариационного ряда, которое соответствует заданному значе­нию вероятности появления признака. При это значение называется нижним квартилем, при верхним квартилем. Например, в выборке из 13 значений нижний квартиль равен 13, верхний ­– 25, а мода 21.

Пример

 

8. Размах выборки

В примере







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.