Здавалка
Главная | Обратная связь

Вибірка. Варіаційний та статистичний ряди



 

У попередній главі розглядалось статистичне означення ймовірності з використанням статистичних рядів. Прикладами їх були таблиці 2 і 3 у § 1.4.

Як складаються статистичні ряди? Які числові характеристики для аналізу статистичного ряду необхідно знаходити? Як для наочності статистичний ряд описують графічно? Коротко ці питання будемо тут розглядати.

Нехай при одних і тих же умовах здійснено випробувань і кожного разу фіксуються значення певної спостережуваної величини. Отримані у результаті випробувань числа називаються вибіркою. Загальне число елементів або одиниць називається обсягом вибірки.

Методи обробки даних вибірки відносять до математичної статистики, яка опирається на апарат теорії ймовірностей.

Математична статистика для економічних спеціальностей вивчається окремим курсом. Ми тут розглянемо ті моменти математичної статистики, які допоможуть студентам краще усвідомити таке поняття теорії ймовірностей, як розподіл випадкових величин. Перейдемо до більш детального вивчення поняття вибірки. Елементи вибірки можуть характеризуватися однією або кількома ознаками.

Так швейні підприємства при випуску одягу враховують попит покупців на той чи інший розмір і зріст. Для більш точного прогнозування потрібно знайти закони розподілу таких ознак як розмір і ріст серед маси населення. Розмір у свою чергу залежить від співвідношення між ростом і вагою конкретної особи.

Нижче подаємо вибірку конкретних даних росту і ваги 54 студентів другого курсу однієї із спеціальностей. Розглянемо основні моменти обробки статистичного матеріалу: побудова статистичного та варіаційного рядів, обчислення основних числових характеристик, графічне зображення розподілу росту, ваги(гістограми) та ін.

В таблиці 1 записані дані вибірки згідно з порядком їх надходжень


Таблиця 1

№ п.п Ріст Вага № п.п Ріст Вага № п.п Ріст Вага
1. 19. 37.
2. 20. 38.
3. 21. 39.
4. 22. 40.
5. 23. 41.
6. 24. 42.
7. 25. 43.
8. 26. 44.
9. 27. 45.
10. 28. 46.
11. 29. 47.
12. 30. 48.
13. 31. 49.
14. 32. 50.
15. 33. 51.
16. 34. 52.
17. 35. 53.
18. 36. 54.

 

Із таблиці видно, що ознаки значення росту і ваги змінюються, або, як кажуть, варіюються при переході від одного номера до іншого. Якщо б не було цього варіювання, і ознака приймала б одне й теж значення, то не було б потреби у проведенні дослідження.

Значення ознаки в окремих членів сукупності (даних таблиці) будемо називати варіантами.

Після збору початкового матеріалу варіанти упорядковують у порядку зростання (або спадання). У таблиці 2 виписані варіанти росту із таблиці 1 у порядку їх зростання. Окремі варіанти повторюються по кілька разів.

Таблиця, в якій елементи вибірки упорядковуються за величиною їх зростання (або спадання) називаєтьсяваріаційним рядом.

Процес упорядкування елементів(вибірки) за зростанням (за спаданням) називається ранжуванням ряду.


Таблица 2

Ріст Ріст Ріст Ріст Ріст
 

 

Отже таблиця 2 - це варіаційний ряд. Різниця між максимальним( ) і мінімальним( ) – елементами вибірки або варіаційного ряду називається розмахом вибірки, позначимо

 

.

 

Значення росту із таблиці 2 зручніше вивчати, якщо їх помістити у таблицю 3, яка будується так.

Всі дані вибірки(див. табл. 2) розбиваються на групи. Кількість груп знаходиться наближено за формулою Стерджесса

 

,

де N – обсяг вибірки(тут N=54, lg54=1,7324, n 1+5,7550 7, n=7 груп).

Кожній групі відповідає інтервал( ) з центром у точці . Довжину інтервалу знаходять за формулою

 

 

 

де - розмах вибірки.

На практиці зручно, щоб h було цілим числом, тому розмах [(170,201)] збільшимо, взявши , а , оскільки цілком можливо, що серед обслідуваних в іншому потоці міг би зустрітися ріст 167 і 202. таким чином маємо

 

Центри інтервалів виберемо у точках: 170, 175, 180, 185, 190, 195, 200. Тоді кінці інтервалів будуть і т.д.

Дані варіаційного ряду (табл. 2) розбиваються на 7 груп (інтервалів) із указаними центрами і поміщаються у таблицю 3.

 

Таблиця 3

Варіанти Інтервали Частоти Відносні частоти Питомі відносні частоти
167,5-172,5 0,074 0,0148
172,5-177,5 0,426 0,085
177,5-182,5 0,222 0,044
182,5-187,5 0,167 0,033
187,5-192,5 0,074 0,0148
192,5-197,5 0,0185 0,0037
197,5-202,5 0,0185 0,037

 

У другому стовпці табл. 3 записані центри інтервалів , які розміщені у стовпці 3. У четвертому стовці поміщені частоти , тобто кількість значень росту із таблиці 2, які попадають у і-тий інтервал. Очевидно, що . У п’ятому стовпці поміщені відповідні відносні частоти

 

.

 

У шостому стовпці поміщені питомі відносні частоти

 

,

де h – довжина інтервалу ( ),

 

.

У нашому випадку h=5.

Отже, кожному інтервалу ( ) приписується значення - (центр інтервалу), яке вважається, що воно повторюється раз.

Означення. Статистичним рядом називається послідовність пар Записується у вигляді таблиці, один рядок якої містить елементи а другий – їх частоти (таку таблицю можно скласти із другого і четвертого стовпців таблиці 3). У загальному вигляді це табл. 4

Таблиця 4 Таблиця 5

Варіанти Частоти   Значення ознаки Частоти
  від α1 до α2
  від α2 до α3
: :   : :
  : :
: :   : :
  від αm до αm+1

 

 


Зауваження. Іноді частоту називають вагою.

У залежності від того, які значення може приймати досліджувана ознака, статистичні ряди діляться на дискретні та інтервальні (неперервні).

Тоді, коли досліджувана ознака приймає тільки дискретні (ізольовані) значення, то статистичний рядтакого типу називається дискретним (табл.4).

Наприклад, група із 20 студентів склали іспит. За отриманими оцінками розподіл студентів подано у табл.6.

 

Таблиця 6.

Оцінки „ 2 ” „ 3 ” „ 4 ” „ 5 ”
Частоти
Відносні частоти 0,1 0,25 0,5 0,15

 

У даному випадку оцінка приймає дискретні значення.

Прикладом неперервного розподілу може служити розподіл росту (табл.5, де (α 1 2), (α 2 3), ..., (α mm+1) – інтервали).

Різниці k1 = α 2 - α 1, k2 = α 3 - α 2, …, km = α m+1 - α m – називаються інтервальними різницями. Часто вибирають k1 = k2 = ...= km = h. Для неперервних розподілів вводиться поняття щільності розподілу, або щільності частоти

 

 

Наприклад, за даними таблиці 3 маємо: і т.д.

 

Результати обчислень щільності частоти записані у таблиці 7


 

Таблиця 7

Інтервал Щільність частоти
167,5-172,5 0,8
172,5-177,5 4,6
177,5-182,5 2,4
182,5-187,5 1,8
187,5-192,5 0,8
192,5-197,5 0,2
197,5-202,5 0,2

 

Якщо ми почнемо додавати частоти або відносні частоти, починаючи з першої варіанти, то отримаємо числа, кожне з яких називається накопиченими частотами або накопиченими відносними частотами (див. табл. 8).

Другий стовпець цієї таблиці отриманий із п’ятого стовпця таблиці 3:

1. 0,074; 2. 0,074 + 0,426 = 0,5; 3. 0,5 + 0,222 = 0,722;

4. 0,722 + 0,167 = 0,889; 5. 0,889 + 0,074 = 0,963;

6. 0,963 + 0,0185 = 0,9815; 7. 0,9815 + 0,0185 = 1,0000.

 

Таким чином частоти накопичуються, внаслідок чого і виникла назва. На рис. 1 зображено графік накопичених частот.

Таблиця 8

Ріст Накопичені відносні частоти
167,5-172,5 0,074
172,5-177,5 0,5
177,5-182,5 0,722
182,5-187,5 0,889
187,5-192,5 0,963
192,5-197,5 0,9815
197,5-202,5

Рис. 1

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.