Здавалка
Главная | Обратная связь

Правило складання (розкладання) дисперсій



 

При групуванні виникає варіація, зумовлена дією різних факторів, які впливають на варіацію ознаки в межах групи і між групами.

У структурованій сукупності, які поділена на групи за факторною ознакою x, дисперсія результативної ознаки y може бути розкладена на:

- дисперсію в кожній групі (внутрішньогрупову);

- дисперсію між групами (міжгрупову).

Загальна дисперсія характеризує варіацію ознаки y за рахунок впливу всіх причин (факторів).

Міжгрупова дисперсія характеризує результат впливу фактора x (групувального). Її обчислюють за формулою:

,

де та - це відповідно середня j-ї групи та загальна середня варіюючої ознаки y; - частота j-ї групи.

Внутрішньогрупові дисперсії розраховуються для кожної j-ї групи:

,

де y – це значення ознаки окремих елементів сукупності.

В цілому для всіх груп визначають середню з внутрішньогрупових дисперсій, яка показує результат впливу інших факторів, що не враховані у групуванні (тобто всіх факторів, окрім фактора x). Для її розрахунку внутрішньогрупові дисперсії ( ) зважують на частоти відповідних груп ( ):

.

Взаємозв`язок між трьома дисперсіями називається правилом складання (розкладання) дисперсій:

,

тобто загальна дисперсія дорівнює сумі міжгрупової дисперсії і середньої з внутрішньогрупових дисперсій. Отже, знаючи дві будь-які дисперсії, на основі наведеної рівності завжди можна визначити третю.

Відношення міжгрупової дисперсії до загальної називається кореляційним відношенням [correlation ratio]:

.

Розв`язок типових задач

 

Задача 1. Визначимо середній, модальний і медіанний вік студентів за даними вищенаведеної таблиці про розподіл студентів-заочників однієї групи (табл.5.1).

Розв`язок задачі.

Для розрахунку зазначених характеристик центру розподілу побудуємо табл.5.4.

Таблиця 5.4

Розподіл студентів за віком

Групи студентів за віком, років (x) Кількість студентів, осіб (fj) Кумулятивні частоти, осіб ( ) Середини інтервалів вікових груп, років (xj)
До 20 17,5
20-25 22,5
25-30 27,5
30 і старші 32,5
Разом Х Х

 

Перший інтервал (відкритий) умовно прирівнюємо по ширині до другого (закритого), а останній (відкритий) - до передостаннього (закритого). Так, якщо ширина другого інтервалу 5 років (20-25), то будемо вважати, що ширина першого інтервалу буде також 5 років (15-20), відповідно його середина – 17,5.

Середнє значення віку визначимо за формулою середньої арифметичної зваженої:

=22,5 (роки).

Серед студентів найбільш вагомою віковою групою є 20-25 років, представників цієї групи 10 осіб. Отже, модальний інтервал визначено. За формулою розрахуємо значення моди в межах цього інтервалу:

Mo= .

Нижня межа визначеного модального інтервалу x0=20, його ширина h=5, частота модального інтервалу fMo=10, частота передмодального інтервалу fMo-1=8, частота післямодального інтервалу fMo+1=4.

Таким чином, мода дорівнюватиме:

Mo= = = 21,3 (роки).

Отже, в групі найчастіше зустрічаються студенти саме з таким віком.

Для визначення медіани спочатку з`ясуємо, якою є половина обсягу сукупності. В нашому випадку =12. Таким чином, перша кумулятивна частота, що перевищує половину обсягу сукупності, становить =18. Ця накопичена частота знаходиться в другому інтервалі – 20-25 років. В межах визначеного медіанного інтервалу визначимо значення медіани:

Me= .

Нижня межа медіанного інтервалу x0=20, його ширина h=5. Частота медіанного інтервалу = 10, кумулятивна частота передмедіанного інтервалу =8. Таким чином,

Me= =22 (роки).

Отже, половина студентів групи мають вік до 22 років, а інша половина – більше 22 років.

Так як ( ), то маємо правосторонню асиметрію розподілу. Перевіримо рівність .

, отже, даний ряд розподілу є помірно асиметричним.

Задача 2. Використовуючи дані попередньої задачі, зробимо висновки щодо однорідності досліджуваної сукупності і асиметричності розподілу.

Розв`язок задачі.

Для цього побудуємо табл.5.5.

Таблиця 5.5

Розрахунок показників варіації віку студентів

Вікові групи студентів, років Кількість студентів, осіб (fj) Середини інтервалів вікових груп, років (xj)
До 20 17,5
20-25 22,5
25-30 27,5
30 і старші 32,5
Разом Х

Використовуючи визначене в попередній задачі значення р., останню графу таблиці 5.4 будемо заповнювати таким чином. В першому інтервалі (до 20 років):

= 200 і т.д.

Для висновку щодо однорідності досліджуваної сукупності визначимо квадратичний коефіцієнт варіації: .

Середнє квадратичне відхилення для згрупованих даних розрахуємо за відповідною формулою: .

Отже, використовуючи дані табл.5.4:

= 4,6 (р.)

Отже, значення віку студентів групи відрізняються від середнього значення ( =22,5 р.) в середньому на 4,6 р.

Квадратичний коефіцієнт варіації становитиме: =20,4%, що свідчить про однорідність досліджуваної сукупності.

Визначимо коефіцієнт асиметрії:

As = = =0,26.

Оскільки As>0, то можемо зробити висновок про правосторонню асиметрію.

Задача 3. За наведеними в табл.5.6 даними визначте коефіцієнти локалізації і концентрації, оцініть нерівномірність розподілу оптового товарообороту суб`єктів оптової торгівлі.

Таблиця 5.6

Групування підприємств Житомирської області за обсягом оптового товарообороту

Класифікаційні групи підприємств за обсягом обороту, тис.грн % до підсумку
Кількість підприємств Обсяг оптового обороту
До 500 49,9 0,9
500,1-10000,0 41,7 17,3
10000,1-50000,0 6,7 19,2
50000,1 і більше 1,7 62,6
Разом 100,0 100,0

 

Розв`язок задачі.

Оцінка нерівномірності розподілу значень ознаки між окремими складовими сукупностей ґрунтується на порівнянні часток двох розподілів – за кількістю елементів сукупності dj та за обсягом значень ознаки Dj. В нашому випадку dj – це частка j-ї класифікаційної групи підприємств у загальній їх кількості, Dj – частка оптового обороту j-ї групи підприємств у загальному обсязі обороту. Для обчислення коефіцієнтів локалізації (Lj) і концентрації (K) побудуємо табл.5.7.

Таблиця 5.7

Розрахунок коефіцієнтів нерівномірності розподілу оптового товарообороту суб`єктів оптової торгівлі

Класифікаційні групи підприємств за обсягом обороту, тис.грн % до підсумку Lj=
Кількість підприємств (dj) Обсяг оптового обороту (Dj)
До 500 49,9 0,9 0,018 0,490
500,1-10000,0 41,7 17,3 0,415 0,244
10000,1-50000,0 6,7 19,2 2,866 0,125
50000,1 і більше 1,7 62,6 36,823 0,609
Разом 100,0 100,0 Х 1,468

 

Отже, можемо зробити висновок, що значні обсяги оптового товарообороту сконцентровані на підприємствах останньої класифікаційної групи (понад 50 млн.грн), про що свідчить найбільший коефіцієнт локалізації Lj =36,8.

Розрахуємо значення коефіцієнту концентрації:

K = =0,734.

Оскільки значення K можуть коливатися в межах від 0 до 1, то K=0,734 свідчить про достатньо високий ступінь концентрації обсягу оптового товарообороту за підприємствами, що займаються оптовою торгівлею.

Задача 4. Відомі такі дані про структуру відправлення (перевезення) пасажирів за видами транспорту в Чернігівській області (табл.5.8):

Таблиця 5.8

Структура перевезення пасажирів за видами транспорту

Види транспорту У % до підсумку
Базисний рік (dj0) Поточний рік (dj1)
Залізничний 7,9 8,6
Автомобільний 53,1 61,4
Тролейбусний 39,0 30,0
Разом 100,0 100,0

Проаналізуйте інтенсивність структурних зрушень за допомогою квадратичного коефіцієнта структурних зрушень.

Розв`язок задачі.

Проведемо необхідні розрахунки зміни часток, які занесемо в табл.5.9.

Таблиця 5.9

Структура і структурні зрушення перевезення пасажирів за видами транспорту

Види транспорту Базисний рік (dj0) Поточний рік (dj1) Δdj=dj1-dj0, процентних пунктів =(dj1-dj0)2
Залізничний 7,9 8,6 +0,7 0,49
Автомобільний 53,1 61,4 +8,3 68,89
Тролейбусний 39,0 30,0 -9,0 81,00
Разом 100,0 100,0 0,0 150,38

Отже, найбільші зміни відбулися за цей період часу у частці перевезень тролейбусним транспортом (вона зменшилася на 9 п.п.).

Визначимо квадратичний коефіцієнт структурних зрушень:

; m=3, оскільки маємо структуру за трьома видами транспорту.

Отже, = 7,1.

Таким чином, структура перевезення пасажирів за видами транспорту (частки окремих видів транспорту) в Чернігівській області змінилася за цей період часу в середньому на 7,1 п.п.

Задача 5. Вартість однокімнатних квартир-новобудов, що пропонувалися в одному з районів міста, різної загальної площі характеризується такими даними:

Групи квартир за розміром загальної площі, м2 Кількість квартир ( ) Вартість квартир, тис.$ (y)   y
42-48 79,5; 79,9; 85,5; 94,0; 117,0; 140,0   595,9 99,3 =
48-54 98,0; 135,0; 140,0; 159,0   532,0 133,0 =
54-60 150,0; 154,0; 178,5   482,5 160,8 =
В цілому Х   1610,4 123,9 =

Визначте внутрішньогрупові, міжгрупову та загальну дисперсії вартості однокімнатних квартир-новобудов, а також питому вагу міжгрупової дисперсії у загальній. Зробіть відповідні висновки.

Розв`язок задачі.

Варіація вартості квартир для кожної їх групи визначається трьома внутрішньогруповими дисперсіями (маємо три групи квартир). Для першої групи квартир внутрішньогрупова дисперсія становитиме:

492,785.

Для другої групи квартир:

488,5,

для третьої –

158,7.

Середня з групових (внутрішньогрупових) дисперсій становитиме:

414,37.

Визначимо міжгрупову дисперсію:

619,0.

Загальну дисперсію можемо визначити за правилом складання дисперсій як суму міжгрупової дисперсії і середньої з внутрішньогрупових дисперсій:

1033,37.

Також можемо обчислити загальну дисперсію за формулою . В такому випадку:

- =1033,37.

Питому вага міжгрупової дисперсії у загальній становить:

= =0,599 або 59,9%.

Отже, варіація вартості однокімнатних квартир-новобудов майже на 60% пояснюється (обумовлена) варіацією їх загальної площі і на 100-60=40% - варіацією інших факторів (які не були враховані в групуванні).

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.