Здавалка
Главная | Обратная связь

Точечные оценки положения, степени и характера рассеяния случайной величины на числовой оси



Целесообразно разделить точечные оценки на оценки, так или иначе характеризующие положение рассеяния на числовой оси, и оценки, характеризующие степень и характер рассеяния случайной величины.

Наиболее употребляемые показатели положения рассеяния на числовой оси достаточно условно разбиты на отдельные подгруппы (рис. 3.1).

Рис. 3.1. Характеристики положения

 

Ниже указаны наиболее важные оценки положения.

Выборочное среднее (среднее арифметическое, математическое ожидание) случайной величины обозначается какудовлетворяет всем приведённым выше требованиям к точечным оценкам. Ниже приведена формула (3.1) оценки для случая, когда значения разбиты по интервалам:

(3.1)

где - среднее значение в i-м интервале,

ki-количество значений , попадающих в i-й интервал.

Медиана (Me) x1/2, квартили х1/4, х1/2, х3/4, децили х01...х09(или х0,1...х0,9) и процентили х001...х099(или х0,01...х0,99) делят упорядоченное распределение (вариационный ряд) Х соответственно на 2,4,10 или 100 интервалов, рис. 3.2. Но следует иметь в виду, что такое деление на соответствующие части происходит не по оси х – делится интегральная функция, как показано для квартилей непрерывной функции распределения, рис. 3.3, или применительно к дискретной функции распределения – накопленная сумма частот. В этом случае, например, xQ1 – (первый квартиль) определяется по накопленной частоте, первой превышающей 25 %, то есть для дискретного распределения квартили совпадают с некоторыми границами интервалов, но деление накопленной суммы частот происходит не на равные части.

Рис. 3.2. Схема взаимного расположения медианы, квартилей,

децилей и персентилей, соответственно деленияинтегральной

функциинепрерывногораспределения на две, четыре, десять и сто равных частей

Мода (Мо)случайной величины - наиболее вероятное значение случайной величины. Иначе - это значение случайной величины, при котором плотность распределения вероятностей имеет максимум.

Квантильсреди показателей положения рассеяния на числовой оси имеетособое значение (рис. 3.2), т.к. он непосредственно определяется интегральной функцией распределения случайной величины. Квантиль (хγ) порядка γ распределения вероятностей (0 <γ< 1) есть такое значение хγ случайной величины X, для которого функция распределения принимает значение γ.

 

Рис. 3.2. Квантиль случайной величины X

 

Характеристики рассеяния относительно центра классифицируются на показатели трёх типов: «кучности» разброса, асимметрии и определяемые законом распределения (рис. 3.3).

 

Рис. 3.3. Характеристики степени и характерарассеяния

 

Ниже рассмотрены наиболее важные из характеристик рассеяния.

Выборочная дисперсия - среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения :

(3.2)

Для генеральной совокупности оценка дисперсии по формуле (2.2) удовлетворяет всем требованиям, предъявляемым к точечным оценкам (см. выше), но применительно к выборке она является смещённой оценкой генеральной дисперсии. Для исправления выборочной дисперсии достаточно умножить ее на дробь Поэтому в качестве исправленной несмещённой оценки генеральной дисперсии по выборке, особенно если nотносительно невелико (n<30), обычно используют:

(3.3)

где - среднее значение выборки.

Если все значения случайной величины сгруппированы по k интервалам, где имеют частоты n1, n2,… nj,…, nk, то формула (3.3) принимает вид:

(3.4)

Стандартное (среднее квадратичное) отклонение (СКО)в отличие от дисперсии имеет размерность, равную размерности . Для выборки (S) и генеральной совокупности ( )оно определяется соответственно:

(3.5)

Отсюда выборочная оценка дисперсии DВчасто обозначается S2.

Замечания:

1. Выборочное СКО S, является лишь оценкой СКО. генеральной совокупностиσ. Поэтому в отличие от σ определяется с некоторой погрешностью, характеристикой которой в свою очередь является СКО величины выборочного СКО SS, рассчитываемая по формуле:

(3.6)

Видно, что погрешность оценки σуменьшается пропорциональноувеличению квадратного корня из объёма выборки n, то есть стремится к 0 при бесконечном увеличении n.

2. С целью повышения точности (уменьшения Sи SS), например, в случае измерении какого-то параметра, это измерение повторяют несколько (n) раз, а потом усредняют. Тогда средняя квадратическая ошибка среднего значения уменьшается относительно СКО единичного значения xi , вычисляемогопо формулам (3.3-3.5), пропорционально квадратному корню из количества nпроизведённых измерений:

, (3.7)

3. Большинство характеристик (кроме асимметрии и эксцесса, подробно описанных в § 3.3) имеют одну особенность - наличие размерности, что не даёт возможности объективно сравнивать разброс величин, имеющих разную размерность. Таким недостатком не обладает коэффициент вариации (V), представляющий собой отношение выборочного СКО Sк среднему (или при n→ ∞СКО σк МО):

V=S/ (3.8)

4. Из формул (3.7) и (3.8) определяется «коэффициент вариации для среднего» :

. (3.9)

5. Приведённые выше формулы универсальны, применимы для выборок, состоящих из самых различных величин. Но в ряде случаев перед проведением описанных расчётов характеристик рассеяния бывает полезна операция приведения к единичному стандартному отклонению. Для этого приводят значения xi к среднему значению: xпi = xi - . Затем, умножая преобразованные значения xпi на 1/s, получают преобразованную выборку случайной величины Z: которая имеет выборочное среднее значе­ние равное нулю и выборочное СКО равное единице.

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.