Вопрос 1. Показатели вариации
Тема 1. 7. Статистическое изучение вариации
К основным показателям вариации относятся: 1. Размах или амплитуда вариации (R) – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в совокупности значений. Размах вариации вычисляется по формуле:
(5.8)
Безусловным достоинством этого показателя является простота расчета. Однако размах вариации зависит от величины только крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями. 2. Среднее линейное отклонение ( ) по абсолютной величине вычисляется как взвешенное по частоте отклонение по модулю середин интервалов от средней арифметической величины. Среднее линейное отклонение вычисляется по формуле:
Простота расчета и интерпретации составляют положительные стороны данного показателя, однако математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является не средний модуль, а среднее квадратическое отклонение. 3. Дисперсия ( ) – средняя из квадратов отклонений вариантов значений признака от их средней величины. Дисперсия рассчитывается по следующим формулам: а) простая (для несгруппированных данных):
б) взвешенная (для сгруппированных данных):
1)
Дисперсия обладает рядом свойств, некоторые из которых позволяют упростить ее вычисления: § дисперсия постоянной величины равна нулю; § если все варианты значения признака уменьшить на одно и то же число, то дисперсия не уменьшится; § если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшиться в k2 раз. 4. Среднее квадратическое отклонение ( ) представляет собой корень квадратный из дисперсии. Данный показатель рассчитывается по следующим формулам: а) для несгруппированных данных:
б) для вариационного ряда:
Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Соотношение зависит от наличия в совокупностях резких, выделяющихся отклонений и может служить индикатором «засоренности» совокупности неоднородными с основной массой элементами: чем это соотношение больше, тем сильнее подобная «засоренность». Для нормального закона распределения .
5. Среднее квартильное расстояние. Данный показатель силы вариации, характеризует ее не по всей совокупности, а лиши в центральной части, т.е. средняя величина разности между квартилями. Данный показатель рассчитывается по формуле:
где q – среднее квартильное расстояние; Q1 и Q3 – соответственно первая и третья квартили распределения.
Этот показатель можно применить вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений. 6. Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более разных признаков необходимы относительные показатели вариации. Они вычисляются как отношение абсолютных показателей силы вариации, рассмотренных ранее, к средней арифметической величине признака. Получаем следующие показатели: а) относительный размах вариации :
(5.15)
б) относительное отклонение по модулю m:
(5.16) в) коэффициент вариации как относительное квадратическое отклонение :
(5.17)
г) относительное квартильное расстояние d:
(5.18)
Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). 7. Межгрупповая дисперсия ( ) является мерой колеблемости частных средних по группам вокруг общей средней и исчисляется по формуле:
(5.19)
где k – число групп; nj – число единиц в j-й группе; – частная средняя по j-й группе; – общая средняя по совокупности единиц.
8. Внутригрупповая дисперсия ( ) характеризует вариацию, обусловленную влиянием случайных факторов, и рассчитывается по формуле:
(5.20)
9. По совокупности в целом вариация значений признака под влиянием прочих факторов характеризуется средней из внутренних дисперсий:
. (5.21) Сумма указанных дисперсий образует общую дисперсию признака:
. (5.22)
Данное равенство определяет правило сложения дисперсий. Оно используется, в частности, в корреляционном анализе при определении тесноты связи результативного признака и факторных. Пример.О производительности станков одного из цехов предприятия известны следующие данные (табл. 5.2). По этим данным необходимо определить: a. внутригрупповую дисперсию по выработке деталей одним станком, определенного вида; b. среднюю из внутригрупповых дисперсий по трем группам станков; c. межгрупповую дисперсию; d. общую дисперсию производительности станков данного цеха.
Таблица - Информация о производительности станков одного из цеха
1. Исчислим вначале средние по каждой группе:
2. Для расчета внутригрупповых дисперсий будем использовать формулу (5.20).
3. Определим среднюю из внутригрупповых дисперсий, используя формулу (5.21):
4. Определим общую среднюю величину для расчета межгрупповой дисперсии:
5. Определим межгрупповую дисперсию, используя формулу (5.19):
6. Вычислим общую дисперсию, используя формулу (5.22):
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|