Доверительный интервал для оценки математического ожидания
нормального распределения при известномσ (σ– среднее квадратное отклонение) Дано: Количественный параметр Х генеральной совокупности распределен нормально. - плотность. Математическое ожидание a – неизвестно. Среднее квадратическое отклонение – известно. Требуется: оценить а по средней выборочной . Данные выборки и среднее выборочное будем рассматривать как случайные величины и , одинаково распределённые с математическим ожиданием a и средним квадратическим отклонением . , ; . Пусть выполняется Р( )= γ, где γ – заданная вероятность. Из курса теории вероятностей известна формула: Р( ) = . Заменим X на , на . Р( ) = = , где . Тогда . Следовательно, Р( )= . Вернемся к обозначению как . Получим Р( . Итак, с достоверной вероятностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр a. Точность оценки .Число t определяется из равенства ,или . При заданной доверительной вероятности по таблице функции Лапласа (табл. 2) находят значение t. Пример 10.Количественный параметр X распределен нормально, . Найти доверительный интервал для оценки неизвестного математического ожидания a по выборочной средней , если объем выборки n = 36 и доверительная вероятность = 0,95. Решение. ; . – доверительный интервал. Если, например, , то (3,12; 5,08). Смысл результата:если произведено достаточно большое число выборок, то 95% из них определяют такие доверительные интервалы, в которых неизвестное математическое ожидание а действительно заключено. Лишь в 5% случаев а может выйти за границы доверительного интервала. Вычисление объема выборки при заданных и Пусть требуется оценить математическое ожидание, если заданы доверительная вероятность и точность оценки . Точность оценки . Тогда . Значит, – минимальный объем выборки, который обеспечит заданную точность . Замечание. Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном . X – количественный признак, распределён нормально. a, – неизвестны. Требуется оценить a . Можно доказать, что - доверительный интервал, покрывающий неизвестное математическое ожидание a с доверительной вероятностью , где – выборочная средняя; – исправленное среднее квадратическое отклонение; – квантиль распределения, который находят по таблице 3 по заданным и . Задачи _______________________________________________________ ´ 1. Найти доверительный интервал для оценки с надежностью 0,99 неизвестного математического ожидания a нормально распределённого признака Х генеральной совокупности, если известны генеральное среднее квадратичное отклонение σ = 4, выборочная средняя и объём выборки n = 16. 2. На овцеводческой ферме из стада произведена выборка для взвешивания 36 овец. Их средний вес оказался равным 50 кг. Предположив распределение веса нормальным и определив несмещённую оценку выборочной дисперсии S2 = 16, найти доверительный интервал для оценки математического ожидания с надёжностью 0,95. 3. Выборка из большой партии электроламп содержит 100 ламп. Средняя продолжительность горения лампы выборки оказалась равной 1000 ч. Найти с надежностью 0,95 доверительный интервал для средней продолжительности a горения лампы всей партии, если известно, что продолжительность горения лампы распределена нормально. 4. Найти минимальный объём выборки, при котором с надежностью 0,975 точность оценки математического ожидания a генеральной совокупности по выборочной средней равна δ = 0,3, если известно среднее квадратичное отклонение σ = 1,2 нормально распределённой генеральной совокупности. 5. Найти минимальный объем выборки, при котором с надежностью 0,925 точность оценки математического ожидания нормально распределённой генеральной совокупности по выборочной средней равна 0,2, если известно среднее квадратичное отклонение генеральной совокупности σ = 1,5. 6. Из генеральной совокупности извлечена выборка:
Оценить с надежностью 0,95 математическое ожидание a нормально распределённого признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 7. Из генеральной совокупности извлечена выборка:
Оценить с надежностью 0,95 математическое ожидание a нормально распределённого признака генеральной совокупности по выборочной средней при помощи доверительного интервала. 8. По данным выборки объёма n = 50 из генеральной совокупности нормально распределённого количественного признака найдено исправленное среднее квадратичное отклонение s = 14. Найти доверительный интервал, покрывающий генеральное среднее квадратичное отклонение σ с надежностью 0,999. 9. Случайная величина Х распределена по нормальному закону. Статистическое распределение выборки представлено в таблице:
Найти с надежностью 0,97 доверительный интервал для оценки математического ожидания и с надежностью 0,95 – для оценки среднего квадратичного отклонения. 10. Случайная величина Х распределена по нормальному закону. Статистическое распределение выборки представлено в таблице:
Найти с надежностью 0,95 доверительный интервал для оценки математического ожидания и с надежностью 0,99 – для оценки среднего квадратичного отклонения. §9. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ
Предположение о том, что статистические данные о количественном признаке Х соответствуют теоретическому закону распределения (назовём его А), является статистической гипотезой, обозначаемой чаще всего через Н . Ставится задача – проанализировав экспериментально полученные данные, обосновать выбор одного из двух решений: 1) принять гипотезу о распределении статистических данных по закону А; 2) отвергнуть гипотезу о соответствии данных выборки закону распределения А. В силу того, что данные выборки случайны, нет гарантии, что принятое решение будет правильным. Возможны два варианта ошибок: 1) ошибка 1-го рода – отвергнута правильная гипотеза; 2) ошибка 2-го рода – принята неправильная гипотеза. Всю ситуацию можно описать таблицей 4 Таблица 4
Вероятность совершить ошибку 1-го рода называют уровнем значимости гипотезы и обозначают a. Величину a задают такой, чтобы случайное событие с вероятностью a можно было считать практически невозможным. Обычно используют значения a, равные 0,01; 0,05; 0,1. Для проверки статистических гипотез используют специально подобранные случайные величины, оценивающие степень расхождения эмпирического и теоретического законов, называемые критериями. Таким образом, гипотеза Н – есть предположение о характере распределения признака Х, а используемый для проверки критерий называют критерием согласия. Выбор теоретического закона распределения А обычно выполняется по гистограмме интервального статистического ряда на основании соответствия её плотности распределения закону А. Наиболее часто выбирается нормальный закон распределения, и для проверки соответствия ему опытных данных используются критерии согласия Пирсона, Ястремского, Колмогорова, Вилкоксона. Опишем процедуру проверки гипотезы о соответствии экспериментальных данных нормальному закону распределения по критерию согласия Пирсона. 1. Примем определённое значение уровня значимости a. 2. Сгруппируем экспериментальные данные в классы (интервалы) таким образом, чтобы в каждый класс попало не менее пяти наблюдений. Число, полученных классов обозначим k. Для расчёта числа классов без учёта объединения существует несколько формул, например к » 1 + 3,2 lg n, где n – объем выборки. 3. Найдём статические оценки параметров нормального распределения:
a и S .
4. Найдём для каждого класса (xi, xi+1) выровненные частоты =Рi× n, где n – объём выборки; Ф(х) – функция Лапласа: (11)
5. В качестве критерия согласия рассмотрим случайную величину, обозначаемую c2 и определяемую по формуле: (12)
Случайная величина Пирсона c2 имеет специальное распределение, зависящее от числа степеней свободы r. Для гипотезы о нормальном распределении Х, число степеней свободы:
r = k – 3, где k – число классов. (13)
Очевидно, что чем ближе эмпирические частоты ni к теоретическим (выровненным) частотам , тем более достоверна гипотеза о нормальном распределении, и в то же время тем меньше значение c2. На рисунке 7 изображён график плотности распределения c2 (дифференциальной функции f(c2)) для r = 6. Вся площадь между графиком и осью абсциссравна единице. Незаштрихованная часть площади равна вероятности , заштрихованная площадь равна вероятности .
Рис. 7 Пусть заштрихованная площадь равна уровню значимости:
(16)
где a – вероятность практически невозможного события. Тогда попадание c2 в интервал практически невозможно. Заштрихованную площадь называют критической областью данного уровня значимости. Очевидно, что чем больше a, тем меньшим (при данном числе степеней свободы r) будет значение . Имеются таблицы распределения (Пирсона), в которых приведены значения для различного числа степеней свободы r и уровней значимости a. При одном и том же уровне значимости a значение возрастает при увеличении числа степеней свободы r. 6. Определяем значение для принятого уровня значимости и числа степеней свободы r. 7. По данным статистического ряда вычисляем наблюдаемое (в данной выборке) значение . Обозначим это значение (15)
8. Сравнивая и решаем вопрос о принятии или отклонении гипотезы Н о соответствии данных выборки нормальному закону распределения, исходя из следующего: – если > , то это означает, что наблюдаемое значение попало в критическую область, т.е. произошло событие, которое считали практически невозможным. Следовательно, данные выборки противоречат гипотезе о нормальном распределении, и гипотеза отвергается; – если , то это означает, что данные выборки не противоречат гипотезе о нормальном распределении, гипотезу можно принять. Пример 11. Проверка по критерию Пирсона гипотезы о нормальном распределении количественного признака Х по результатам 150 его измерений, сведённых в таблицу частот:
Построим гистограмму, где по оси абсцисс отложим отрезки [xi; xi+1], а hi=Wi/Dxi=Wi/3.
По форме гистограммы выдвинем гипотезу Н : изучаемый признак Х имеет нормальный закон распределения. Найдём оценки числовых характеристик закона: - выборочные средняя и дисперсия: - исправленное среднее квадратичное отклонение: Вычисляем значения аргумента и значения функции Лапласа (по таблице значений функции Лапласа) в этих точках. Приведём вычисления для первого и последнего классов.
Для остальных классов выравненные относительные частоты Pi и выравненные частоты определяются аналогично. Выравненные частоты для укрупненных классов приведены в таблице
Примечание. Два первых класса и два последних класса объединены ввиду их малочисленности. Этапы реализации критерия Пирсона: 1. Примем уровень значимости a = 0,05. 2. Сгруппируем классы так, чтобы частота в каждом классе была не менее пяти. Для этого объединим два первых класса и объединим два последних класса. При этом частоты ni и выравненные частоты ni’ для объединенных классов суммируются. Число классов стало k = 8. В каждом классе подсчитываем величину . 3. Из таблицы критических точек распределения (см. приложение 6) найдем для числа степеней свободы r = 8 – 3 = 5 и принятого уровня значимости a = 0,05. Получим . 4. По последней таблице подсчитываем наблюдаемое значение критерия 5. Сравним и . Так как , то гипотезу о нормальном распределении можно считать правдоподобной. Задачи _______________________________________________________ ´ 1. Результаты взвешивания 50 случайным образом отобранных пачек чая приведены ниже (в граммах): 2. Масса (в граммах) произвольно выбранных 30 пачек полуфабриката «Геркулес» такова: 503; 509; 495; 493; 489; 485; 507; 511; 487; 495; 506; 504; 507; 511; 499; 491; 494; 518; 506; 515; 487; 509; 507; 488; 495; 490; 498; 497; 492; 495. 3. Результаты исследования числа покупателей в универсаме, в зависимости от времени работы, приведены ниже:
Можно ли утверждать при уровне значимости α = 0,05, что случайная величина X – число покупателей – подчинена нормальному закону распределения? 4. При обследовании диаметров карданных валов автомобиля, выпускаемых заводом, были зафиксированы отклонения от номинала Δd (мкм), приведенные в таблице:
Проверить гипотезу о нормальном распределении случайной величины Δd при уровне доверия g = 0,9. 5. Интервал движения поездов метро составляет 2 минуты. В таблице приведены значения случайной величины X – времени ожидания пассажирами поезда:
Проверить гипотезу о нормальном распределении случайной величины X при уровне значимости α = 0,01. 6. По данным выборочного обследования получено распределение семей по среднедушевому доходу (в усл. ед.):
Проверить гипотезу о нормальном распределении случайной величины – среднедушевого дохода семьи – при уровне доверия g = 0,9. 7. В таблице приведены значения прибыли 50 фирм, принадлежащих одной корпорации, Q (1000 усл. ед.):
Проверить гипотезу о нормальности распределения случайной величины Q при уровне доверия g = 0,99. 8. Имеются данные о годовой мощности М (тыс. т) предприятия цементной промышленности:
Проверить гипотезу о нормальности распределения случайной величины М при уровне доверия g = 0,9. 9. Для определения средней заработной платы работников определённой отрасли было обследовано 100 человек. Результаты представлены в следующей таблице (данные условные):
Выяснить, можно ли при уровне значимости α = 0,05 считать нормальным распределение средней заработной платы. 10. В 1889–1890 годах был измерено рост 1000 взрослых мужчин (рабочих московских фабрик). Результаты измерений представлены в таблице:
Проверить при уровне доверия 0,95 гипотезу, состоящую в том, что рост взрослого мужчины (случайная величина Х) имеет нормальное распределение. ©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|