Здавалка
Главная | Обратная связь

Доверительный интервал для оценки математического ожидания



нормального распределения при известномσ

(σ– среднее квадратное отклонение)

Дано: Количественный параметр Х генеральной совокупности распределен нормально.

- плотность.

Математическое ожидание a – неизвестно.

Среднее квадратическое отклонение – известно.

Требуется: оценить а по средней выборочной .

Данные выборки и среднее выборочное будем рассматривать как случайные величины и , одинаково распределённые с математическим ожиданием a и средним квадратическим отклонением .

,

; .

Пусть выполняется Р( )= γ, где γ – заданная вероятность.

Из курса теории вероятностей известна формула: Р( ) = . Заменим X на , на .

Р( ) = = , где .

Тогда . Следовательно, Р( )= .

Вернемся к обозначению как . Получим

Р( .

Итак, с достоверной вероятностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр a. Точность оценки .Число t определяется из равенства ,или .

При заданной доверительной вероятности по таблице функции Лапласа (табл. 2) находят значение t.

Пример 10.Количественный параметр X распределен нормально, . Найти доверительный интервал для оценки неизвестного математического ожидания a по выборочной средней , если объем выборки n = 36 и доверительная вероятность = 0,95.

Решение.

; .

– доверительный интервал.

Если, например, , то (3,12; 5,08).

Смысл результата:если произведено достаточно большое число выборок, то 95% из них определяют такие доверительные интервалы, в которых неизвестное математическое ожидание а действительно заключено. Лишь в 5% случаев а может выйти за границы доверительного интервала.

Вычисление объема выборки при заданных и

Пусть требуется оценить математическое ожидание, если заданы доверительная вероятность и точность оценки .

Точность оценки . Тогда .

Значит, – минимальный объем выборки, который обеспечит заданную точность .

Замечание. Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном .

X – количественный признак, распределён нормально. a, – неизвестны.

Требуется оценить a .

Можно доказать, что - доверительный интервал, покрывающий неизвестное математическое ожидание a с доверительной вероятностью , где – выборочная средняя; – исправленное среднее квадратическое отклонение; – квантиль распределения, который находят по таблице 3 по заданным и .

Задачи _______________________________________________________ ´

1. Найти доверительный интервал для оценки с надежностью 0,99 неизвестного математического ожидания a нормально распределённого признака Х генеральной совокупности, если известны генеральное среднее квадратичное отклонение σ = 4, выборочная средняя и объём выборки n = 16.

2. На овцеводческой ферме из стада произведена выборка для взвешивания 36 овец. Их средний вес оказался равным 50 кг. Предположив распределение веса нормальным и определив несмещённую оценку выборочной дисперсии S2 = 16, найти доверительный интервал для оценки математического ожидания с надёжностью 0,95.

3. Выборка из большой партии электроламп содержит 100 ламп. Средняя продолжительность горения лампы выборки оказалась равной 1000 ч. Найти с надежностью 0,95 доверительный интервал для средней продолжительности a горения лампы всей партии, если известно, что продолжительность горения лампы распределена нормально.

4. Найти минимальный объём выборки, при котором с надежностью 0,975 точность оценки математического ожидания a генеральной совокупности по выборочной средней равна δ = 0,3, если известно среднее квадратичное отклонение σ = 1,2 нормально распределённой генеральной совокупности.

5. Найти минимальный объем выборки, при котором с надежностью 0,925 точность оценки математического ожидания нормально распределённой генеральной совокупности по выборочной средней равна 0,2, если известно среднее квадратичное отклонение генеральной совокупности σ = 1,5.

6. Из генеральной совокупности извлечена выборка:

xi -2
ni

Оценить с надежностью 0,95 математическое ожидание a нормально распределённого признака генеральной совокупности по выборочной средней при помощи доверительного интервала.

7. Из генеральной совокупности извлечена выборка:

xi -0,5 -0,4 -0,2 0,2 0,6 0,8 1,2 1,5
ni

Оценить с надежностью 0,95 математическое ожидание a нормально распределённого признака генеральной совокупности по выборочной средней при помощи доверительного интервала.

8. По данным выборки объёма n = 50 из генеральной совокупности нормально распределённого количественного признака найдено исправленное среднее квадратичное отклонение s = 14. Найти доверительный интервал, покрывающий генеральное среднее квадратичное отклонение σ с надежностью 0,999.

9. Случайная величина Х распределена по нормальному закону. Статистическое распределение выборки представлено в таблице:

xi
ni

Найти с надежностью 0,97 доверительный интервал для оценки математического ожидания и с надежностью 0,95 – для оценки среднего квадратичного отклонения.

10. Случайная величина Х распределена по нормальному закону. Статистическое распределение выборки представлено в таблице:

xi
ni

Найти с надежностью 0,95 доверительный интервал для оценки математического ожидания и с надежностью 0,99 – для оценки среднего квадратичного отклонения.

§9. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ
СТАТИСТИЧЕСКИХ ДАННЫХ
ТЕОРЕТИЧЕСКОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ

 

Предположение о том, что статистические данные о количественном признаке Х соответствуют теоретическому закону распределения (назовём его А), является статистической гипотезой, обозначаемой чаще всего через Н . Ставится задача – проанализировав экспериментально полученные данные, обосновать выбор одного из двух решений:

1) принять гипотезу о распределении статистических данных по закону А;

2) отвергнуть гипотезу о соответствии данных выборки закону распределения А.

В силу того, что данные выборки случайны, нет гарантии, что принятое решение будет правильным. Возможны два варианта ошибок:

1) ошибка 1-го рода – отвергнута правильная гипотеза;

2) ошибка 2-го рода – принята неправильная гипотеза.

Всю ситуацию можно описать таблицей 4

Таблица 4

Решение Гипотеза
правильная неправильная
Принять гипотезу Нет ошибки Ошибка 2-го рода
Отвергнуть гипотезу Ошибка 1-го рода Нет ошибки

 

Вероятность совершить ошибку 1-го рода называют уровнем значимости гипотезы и обозначают a. Величину a задают такой, чтобы случайное событие с вероятностью a можно было считать практически невозможным. Обычно используют значения a, равные 0,01; 0,05; 0,1. Для проверки статистических гипотез используют специально подобранные случайные величины, оценивающие степень расхождения эмпирического и теоретического законов, называемые критериями. Таким образом, гипотеза Н – есть предположение о характере распределения признака Х, а используемый для проверки критерий называют критерием согласия. Выбор теоретического закона распределения А обычно выполняется по гистограмме интервального статистического ряда на основании соответствия её плотности распределения закону А. Наиболее часто выбирается нормальный закон распределения, и для проверки соответствия ему опытных данных используются критерии согласия Пирсона, Ястремского, Колмогорова, Вилкоксона.

Опишем процедуру проверки гипотезы о соответствии экспериментальных данных нормальному закону распределения по критерию согласия Пирсона.

1. Примем определённое значение уровня значимости a.

2. Сгруппируем экспериментальные данные в классы (интервалы) таким образом, чтобы в каждый класс попало не менее пяти наблюдений. Число, полученных классов обозначим k. Для расчёта числа классов без учёта объединения существует несколько формул, например

к » 1 + 3,2 lg n, где n – объем выборки.

3. Найдём статические оценки параметров нормального распределения:

 

a и S .

 

4. Найдём для каждого класса (xi, xi+1) выровненные частоты i× n, где n – объём выборки; Ф(х) – функция Лапласа:

 
 


(11)

 

5. В качестве критерия согласия рассмотрим случайную величину, обозначаемую c2 и определяемую по формуле:

 
 


(12)

 

Случайная величина Пирсона c2 имеет специальное распределение, зависящее от числа степеней свободы r. Для гипотезы о нормальном распределении Х, число степеней свободы:

 

r = k – 3, где k – число классов. (13)

 

Очевидно, что чем ближе эмпирические частоты ni к теоретическим (выровненным) частотам , тем более достоверна гипотеза о нормальном распределении, и в то же время тем меньше значение c2.

На рисунке 7 изображён график плотности распределения c2 (дифференциальной функции f(c2)) для r = 6. Вся площадь между графиком и осью абсциссравна единице. Незаштрихованная часть площади равна вероятности , заштрихованная площадь равна вероятности .

 
 

 

 


Рис. 7

Пусть заштрихованная площадь равна уровню значимости:

 

(16)

 

где a – вероятность практически невозможного события. Тогда попадание c2 в интервал практически невозможно. Заштрихованную площадь называют критической областью данного уровня значимости.

Очевидно, что чем больше a, тем меньшим (при данном числе степеней свободы r) будет значение . Имеются таблицы распределения (Пирсона), в которых приведены значения для различного числа степеней свободы r и уровней значимости a. При одном и том же уровне значимости a значение возрастает при увеличении числа степеней свободы r.

6. Определяем значение для принятого уровня значимости и числа степеней свободы r.

7. По данным статистического ряда вычисляем наблюдаемое (в данной выборке) значение . Обозначим это значение

 
 


(15)

 

8. Сравнивая и решаем вопрос о принятии или отклонении гипотезы Н о соответствии данных выборки нормальному закону распределения, исходя из следующего:

– если > , то это означает, что наблюдаемое значение попало в критическую область, т.е. произошло событие, которое считали практически невозможным. Следовательно, данные выборки противоречат гипотезе о нормальном распределении, и гипотеза отвергается;

– если , то это означает, что данные выборки не противоречат гипотезе о нормальном распределении, гипотезу можно принять.

Пример 11. Проверка по критерию Пирсона гипотезы о нормальном распределении количественного признака Х по результатам 150 его измерений, сведённых в таблицу частот:

 

Границы интервала (xi - xi+1) Частота ni Относительная частота wi Середина интервала x*i
24,5–27,5 0,0067
27,5–30,5 0,0267
30,5–33,5 0,0867
33,5–36,5 0,1533
36,5–39,5 0,1467
39,5–42,5 0,1933
42,5–45,5 0,1933
45,5–48,5 0,1067
48,5–51,5 0,0733
51,5–54,5 0,0133

Построим гистограмму, где по оси абсцисс отложим отрезки [xi; xi+1],

а hi=Wi/Dxi=Wi/3.

 

 

 


 

 

По форме гистограммы выдвинем гипотезу Н : изучаемый признак Х имеет нормальный закон распределения. Найдём оценки числовых характеристик закона:

- выборочные средняя и дисперсия:

- исправленное среднее квадратичное отклонение:

Вычисляем значения аргумента и значения функции Лапласа (по таблице значений функции Лапласа) в этих точках.

Приведём вычисления для первого и последнего классов.

 

Для остальных классов выравненные относительные частоты Pi и выравненные частоты определяются аналогично.

Выравненные частоты для укрупненных классов приведены в таблице

 

Границы интервала xi-xi+1 Частота ni Относительная частота wi Выравненная относительная частота Pi Выравненная частота ni'=Pi×150
24,5–27,5 0,0067 0,12
27,5–30,5 0,0267
30,5–33,5 0,0867 0,0711 10,67 0,51
33,5–39,5 0,1533 0,1308 19,62 0,58
36,5–39,5 0,1467 0,1905 28,58 1,57
39,5–42,5 0,1933 0,2043 30,65 0,09
42,5–45,5 0,1933 0,1738 26,07 0,33
45,5–48,5 0,1067 0,1086 16,29 0,1
48,5–51,5 0,0733   0,031
51,5–54,5 0,0133

Примечание. Два первых класса и два последних класса объединены ввиду их малочисленности.

Этапы реализации критерия Пирсона:

1. Примем уровень значимости a = 0,05.

2. Сгруппируем классы так, чтобы частота в каждом классе была не менее пяти. Для этого объединим два первых класса и объединим два последних класса. При этом частоты ni и выравненные частоты ni для объединенных классов суммируются. Число классов стало k = 8. В каждом классе подсчитываем величину .

3. Из таблицы критических точек распределения (см. приложение 6) найдем для числа степеней свободы r = 8 – 3 = 5 и принятого уровня значимости a = 0,05. Получим .

4. По последней таблице подсчитываем наблюдаемое значение критерия

5. Сравним и .

Так как , то гипотезу о нормальном распределении можно считать правдоподобной.

Задачи _______________________________________________________ ´

1. Результаты взвешивания 50 случайным образом отобранных пачек чая приведены ниже (в граммах):
150; 147; 152; 148; 149; 153; 151; 150; 149; 147; 153; 151; 152; 151; 149; 152; 150; 148; 152; 150; 152; 151; 148; 151; 152; 150; 151; 149; 148; 149; 150; 150; 151; 149; 151; 150; 151; 150; 149; 148; 147; 153; 147; 152; 150; 151; 149; 150; 151; 153.
Можно ли утверждать при уровне значимости α = 0,05, что случайная величина X – масса пачки чая – подчинена нормальному закону распределения?

2. Масса (в граммах) произвольно выбранных 30 пачек полуфабриката «Геркулес» такова: 503; 509; 495; 493; 489; 485; 507; 511; 487; 495; 506; 504; 507; 511; 499; 491; 494; 518; 506; 515; 487; 509; 507; 488; 495; 490; 498; 497; 492; 495.
Можно ли при уровне значимости α = 0,05 утверждать, что случайная величина X – масса пачки – подчинена нормальному закону распределения?

3. Результаты исследования числа покупателей в универсаме, в зависимости от времени работы, приведены ниже:

Часы работы [9; 10) [10; 11) [11; 12) [12; 13]
Число покупателей

Можно ли утверждать при уровне значимости α = 0,05, что случайная величина X – число покупателей – подчинена нормальному закону распределения?

4. При обследовании диаметров карданных валов автомобиля, выпускаемых заводом, были зафиксированы отклонения от номинала Δd (мкм), приведенные в таблице:

-8,760 -1,455 -1,455 -4,665 -2,250 2,560 -1,645 0,425 0,650 -1,220
-6,280 8,550 3,170 0,360 2,450 1,590 -5,435 4,495 5,140 -6,520
7,655 -2,215 7,045 8,650 -1,660 1-745 -1,460 -4,415 -0,280 3,785
-4,790 1,240 -0,475 -7,440 -1,805 -0,295 -2,695 -0,390 1,145 0,970
2,075 -6,910 0,645 -11,805 -5,435 -5,420 1,590 1,835 -4,960 2,645

Проверить гипотезу о нормальном распределении случайной величины Δd при уровне доверия g = 0,9.

5. Интервал движения поездов метро составляет 2 минуты. В таблице приведены значения случайной величины X – времени ожидания пассажирами поезда:

0,000 0,002 0,007 0,025 0,089 0,312 1,068 1,604 0,014 0,045
1,747 1,677 0,341 0,952 0,945 1,297 1,981 0,214 1,452 0,787
1,954 0,838 0,143 1,317 0,618 1,853 1,555 0,953 1,922 1,653
0,617 0,828 1,413 1,030 1,459 1,483 1,769 1,265 1,669 0,635
0,787 1,004 0,941 0,612 1,200 1,692 1,356 0,908 1,245 1,295

Проверить гипотезу о нормальном распределении случайной величины X при уровне значимости α = 0,01.

6. По данным выборочного обследования получено распределение семей по среднедушевому доходу (в усл. ед.):

10,984 22,672 17,536 21,400 29,096 22,368 25,680 26,040 23,048 17,944
14,952 38,608 30,072 25,576 28,920 27,544 16,304 32,192 33,224 14,568
37,248 21,456 36,272 38,540 22,872 27,792 22,664 17,936 24,552 31,056
17,336 26,984 24,240 13,096 22,112 24,528 20,688 24,376 26,832 26,552
28,320 13,944 26,032 6,112 16,304 16,328 27,936 17,064 27,544 29,232

Проверить гипотезу о нормальном распределении случайной величины – среднедушевого дохода семьи – при уровне доверия g = 0,9.

7. В таблице приведены значения прибыли 50 фирм, принадлежащих одной корпорации, Q (1000 усл. ед.):

4,744 9,127 7,201 8,650 11,536 9,013 10,255 10,390 9,268 7,354
6,232 15,103, 11,902 10,216 11,470 10,954 6,739 12,697 13,084 6,088
14,593 8,671 14,227 15,190 9,202 11,047 9,124 7,351 9,832 12,271
7,126 10,744 9,715 5,536 8,917 9,823 8,383 9,766 10,687 10,582
11,245 5,854 10,387 2,917 6,739 6,748 10,954 11,101 7,024 11,587

Проверить гипотезу о нормальности распределения случайной величины Q при уровне доверия g = 0,99.

8. Имеются данные о годовой мощности М (тыс. т) предприятия цементной промышленности:

11,240 18,545 15,335 17,750 22,560 18,355 20,425 20,650 18,780 15,590
13,720 28,505 23,170 20,360 22,450 21,590 14,565 24,495 25,140 13,400
27,655 17,785 27,045 28,650 18,670 71,745 18,540 15,585 19,720 23,785
15,210 21,240 19,525 12,560 18,195 19,705 17,305 19,610 21,145 20,970
22,075 13,090 20,645 8,195 14,565 14,580 21,590 21,835 15,040 22,645

Проверить гипотезу о нормальности распределения случайной величины М при уровне доверия g = 0,9.

9. Для определения средней заработной платы работников определённой отрасли было обследовано 100 человек. Результаты представлены в следующей таблице (данные условные):

Зарплата, долл. [190; 192) [192; 194) [194; 196) [196; 198) [198; 200)
Число человек
Зарплата, долл. [200; 202) [202; 204) [204; 206) [206; 208]  
Число человек  

Выяснить, можно ли при уровне значимости α = 0,05 считать нормальным распределение средней заработной платы.

10. В 1889–1890 годах был измерено рост 1000 взрослых мужчин (рабочих московских фабрик). Результаты измерений представлены в таблице:

Рост, см [143; 146) [146; 149) [149; 152) [152; 155) [155; 158)
Число человек
Рост, см [158; 161) [161; 164) [164; 167) [167; 170) [170; 173)
Число человек
Рост, см [173; 176) [176; 179) [179; 182) [182; 185) [185; 188]
Число человек

Проверить при уровне доверия 0,95 гипотезу, состоящую в том, что рост взрослого мужчины (случайная величина Х) имеет нормальное распределение.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.