Эмпирическая функция распределения
: Определение. Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события Х < х. где nx – число вариантов (число хi) меньших х; n – объем выборки.
Свойства: 1. Значение F*(х) принадлежит отрезку [0, 1]: ; 2. F*(х) – неубывающая функция; 3. Если xi – наименьшее наблюдаемое значение, хk – наибольшее наблюдаемое значение, то F*(х) = 0 при ; F*(х) = 1 при . Пример 7. Пусть результаты наблюдений представлены в виде следующего ДСР (данные примера 3):
Объём выборки по условию примера n = 20. Наименьшая варианта равна 1, значит, mx = 0 при x ≤ 1. Тогда при x ≤ 20. Следующая варианта в ранжированном ряду равна 2. Рассмотрим 1 < x ≤ 2. В этом случае неравенство X < x выполняется для варианты x1 = 1. Эта варианта встречается один раз в выборке, поэтому mx = 1 и . Далее, если 2 < x ≤ 3, то неравенство X < x выполняется для вариант x1 = 1 и x2 = 2. Варианта x1 встречается один раз, а варианта x2 встречается два раза, поэтому mx = 1 + 2 = 3 и и т.д. Следовательно, аналитически функция определяется следующим образом:
Суммы обычно называются накопленными относительными частотами. Построим график по данным примера 7 (рис. 6).
Рис. 6 Если результаты наблюдений представлены в виде ИСР, то выборочную функцию строят иначе. Пример 8. Рассмотрим для этого следующий вариационный ряд:
Очевидно, что для функция , т.к. mx = 0. Пусть теперь . В этом случае число не определено, т.к. неизвестно, сколько выборочных значений случайной величины, принадлежащих этому интервалу, меньше x. Если x = 10, то mx = 1. Следовательно, в этом случае . Рассуждая аналогично, убеждаемся, что точками, в которых значение функции можно определить, являются правые концы интервалов и все точки интервала . Значение функции в указанных точках можно записать в виде таблицы:
Так как эта таблица определяет функцию не полностью (не для всех x известны ее значения), то при графическом изображении данной функции ее доопределяют, соединив точки графика, соответствующие концам интервалов, отрезками прямой. В результате график функции будет представлять собой непрерывную линию. Подобный график выборочной функции часто называют кумулятивной кривой (от англ. accumulation – накопление). Построим график по данным примера 8 (рис. 7).
Рис. 7
Задачи _______________________________________________________ ´ 1. Для проведения демографических исследований выбрали 50 семей и получили следующие данные о количестве членов семьи: Составить ДСР. 2. В ходе проведения эксперимента получен следующий набор данных: Составить ИСР, выбрав число интервалов группирования, равное 7. 3. На телефонной станции проводились наблюдения над числом X неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты: Составить ДСР. 4. Управление сельского хозяйства Костромского района представило сводку по пятидесяти хозяйствам. Согласно этой сводке урожайность ржи в них составила (в центнерах с гектара):
Составить ИСР. 5. Наблюдается число выигрышей в мгновенной лотерее. В результате наблюдения получены следующие значения выигрышей (тыс. руб.): Составить ДСР. 6. В таблице приведена выборка результатов измерения роста 105 студентов (юношей). Измерения проводились с точностью до 1 см: Составить ИСР. 7. В супермаркете проводились наблюдения над числом X покупателей, обратившихся в кассу за один час. Наблюдения в течение 30 часов (15 дней в период с 9 до 10 и с 10 до 11 часов) дали следующие результаты: Число X является дискретной случайной величиной, а полученные данные представляют собой выборку из n = 30 наблюдений. Составить ИСР. 8. В городе A для определения сроков гарантийного обслуживания проведено исследование величины среднего пробега автомобилей, находящихся в эксплуатации в течение двух лет с момента продажи автомобиля магазином. Получен следующий результат (тыс. км):
Составить ИСР. 9. Средняя месячная зарплата за год каждого из пятидесяти случайно отобранных работников хозяйства такова (тыс. руб.): Здесь случайной величиной X является средняя месячная зарплата. Составить ИСР. 10. На фирме работает 39 человек. Проведено исследование числа рабочих дней, пропущенных каждым работником фирмы в течение месяца. Результаты этого исследования таковы: Составить ИСР. Найти функцию распределения случайной величины числа пропущенных дней и построить ее график. 11. Найти эмпирическую функцию распределения по данному ДСР и построить ее график: а)
б)
12. Найти эмпирическую функцию распределения по данному ИСР и построить ее график:
а)
13. Построить полигоны частот и относительных частот распределения по данному ДСР:
14. Построить полигон частот по данному ДСР:
15. Построить полигоны относительных частот по данному ДСР:
16. Построить гистограмму частот по данному ИСР:
17. Построить гистограмму относительных частот по данному ИСР:
18. Построить гистограмму относительных частот по данному ИСР:
19. Построить гистограмму относительных частот по данному ИСР:
20. Построить гистограмму относительных частот по данному ИСР:
21. Построить гистограмму относительных частот по данному ИСР:
22. Построить гистограмму относительных частот по данному ИСР:
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|