Здавалка
Главная | Обратная связь

Проверка предположений



Напомним, что t-распределение основано на предположении, что изучаемая случайная величина Xявляется нормально распределенной. Однако на практике t-распределение можно применять для оценки неизвестного математического ожидания генеральной совокупности при неизвестном стандартном отклонении при достаточно большом объеме выборки и не слишком асимметричном распределении. При работе с небольшими выборками эти условия уже не выполняются автоматически, поэтому их следует проверять. Для этого необходимо строить гистограмму, блочную диаграмму или график нормального распределения.

Критические значения для t-распределения с соответствующими степенями свободы табулированы (см. табл. 2).

В верхней части таблицы указаны уровни значимости αдля двусторонней критической области, когда α содержит левый и правый «хвосты»t-распределения (см. рис. 1). А в нижней части таблицы указаны уровни значимости αдля односторонней критической области, когда α содержит либо левый, либо правый «хвосты»t-распределения, каждый из которых по площади равен величине α/2.

Например, в табл. 2 показано, как найти площадь фигуры, ограниченной t-распределением, имеющим 99 степеней свободы, и соответствующим значением переменной t, если необходимо построить интервал, доверительный уровень которого равен 95%. Этот доверительный уровень ограничен с двух сторон «хвостами» α, в сумме равными величине 0,05.Найдем пересечение столбца, соответствующего величине 0,05, и строки, соответствующей 99 степеням свободы. В этой ячейке записано критическое значение, равное 1,98.

Степени свободы

Напомним, что для вычисления выборочной дисперсии S2 необходимо определить величину

,

т.е. при вычислении выборочной дисперсии вначале надо установить значение . Поэтому, мы можем варьировать лишь п-1выборочными значениями. Это означает, что величина S2 обладает п-1степенями свободы и определяется по формуле:

Допустим, например, что выборка состоит из 5 чисел, а ее выборочное среднее равно 20. Сколько разных значений необходимо знать для того, чтобы однозначно определить остальные? Если п= 5 и = 20, то

,

поскольку

.

Таким образом, если известны четыре величины, пятое значение уже несвободно, поскольку сумма должна быть равна 100. Например, если нам известны величины 18, 24,19 и 16, пятая величина должна быть равной 23, поскольку сумма равна 100.

Доверительный интервал

Рассмотрим формулу для вычисления интервала, содержащего математическое ожидание при неизвестном стандартном отклонении с вероятностью (1-α)×100%.

 

или (7)

.

где tn-1 - критическое значение t-распределения с n-1 степенями свободы и соответствующим значением α.

Чтобы проиллюстрировать применение этой формулы, проведем анализ работы магазина по продаже молочной продукцию. С целью установления математического ожидания стоимости одной покупки извлечена выборка, состоящая из 100 чеков на проданную продукцию в течение последнего месяца. Допустим, что выборочное среднее равно 110,27руб., а выборочное стандартное отклонение — 28,95 руб. Если построить интервал, имеющий доверительный уровень, равный 95%, критическое значение t-распределения равно 1,98 (см. табл. 2). Используя формулу (7), получаем:

,

104,53 ≤ µ ≤ 116,01.

 

Таким образом, вероятность того, что средняя стоимость одной покупки находится в интервале от 104,53 до 116,01, равна 95%. Это значит, что если мы извлечем все возможные выборки, состоящие из 100 чеков продажи (что практически невозможно), то 95% доверительных интервалов будут содержать математическое ожидание генеральной совокупности. Корректность этих доверительных интервалов зависит от того, насколько распределение генеральной совокупности близко к нормальному. Поскольку объем выборки довольно велик (n = 100),предположение о нормальном распределении вполне правдоподобно, а полученная оценка математического ожидания довольно надежна. Таким образом, применение t-распределения вполне оправданно.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.