Правило складання (розкладання) дисперсій ⇐ ПредыдущаяСтр 3 из 3
При групуванні виникає варіація, зумовлена дією різних факторів, які впливають на варіацію ознаки в межах групи і між групами. У структурованій сукупності, які поділена на групи за факторною ознакою x, дисперсія результативної ознаки y може бути розкладена на: - дисперсію в кожній групі (внутрішньогрупову); - дисперсію між групами (міжгрупову). Загальна дисперсія характеризує варіацію ознаки y за рахунок впливу всіх причин (факторів). Міжгрупова дисперсія характеризує результат впливу фактора x (групувального). Її обчислюють за формулою: , де та - це відповідно середня j-ї групи та загальна середня варіюючої ознаки y; - частота j-ї групи. Внутрішньогрупові дисперсії розраховуються для кожної j-ї групи: , де y – це значення ознаки окремих елементів сукупності. В цілому для всіх груп визначають середню з внутрішньогрупових дисперсій, яка показує результат впливу інших факторів, що не враховані у групуванні (тобто всіх факторів, окрім фактора x). Для її розрахунку внутрішньогрупові дисперсії ( ) зважують на частоти відповідних груп ( ): . Взаємозв`язок між трьома дисперсіями називається правилом складання (розкладання) дисперсій: , тобто загальна дисперсія дорівнює сумі міжгрупової дисперсії і середньої з внутрішньогрупових дисперсій. Отже, знаючи дві будь-які дисперсії, на основі наведеної рівності завжди можна визначити третю. Відношення міжгрупової дисперсії до загальної називається кореляційним відношенням [correlation ratio]: . Розв`язок типових задач
Задача 1. Визначимо середній, модальний і медіанний вік студентів за даними вищенаведеної таблиці про розподіл студентів-заочників однієї групи (табл.5.1). Розв`язок задачі. Для розрахунку зазначених характеристик центру розподілу побудуємо табл.5.4. Таблиця 5.4 Розподіл студентів за віком
Перший інтервал (відкритий) умовно прирівнюємо по ширині до другого (закритого), а останній (відкритий) - до передостаннього (закритого). Так, якщо ширина другого інтервалу 5 років (20-25), то будемо вважати, що ширина першого інтервалу буде також 5 років (15-20), відповідно його середина – 17,5. Середнє значення віку визначимо за формулою середньої арифметичної зваженої: =22,5 (роки). Серед студентів найбільш вагомою віковою групою є 20-25 років, представників цієї групи 10 осіб. Отже, модальний інтервал визначено. За формулою розрахуємо значення моди в межах цього інтервалу: Mo= . Нижня межа визначеного модального інтервалу x0=20, його ширина h=5, частота модального інтервалу fMo=10, частота передмодального інтервалу fMo-1=8, частота післямодального інтервалу fMo+1=4. Таким чином, мода дорівнюватиме: Mo= = = 21,3 (роки). Отже, в групі найчастіше зустрічаються студенти саме з таким віком. Для визначення медіани спочатку з`ясуємо, якою є половина обсягу сукупності. В нашому випадку =12. Таким чином, перша кумулятивна частота, що перевищує половину обсягу сукупності, становить =18. Ця накопичена частота знаходиться в другому інтервалі – 20-25 років. В межах визначеного медіанного інтервалу визначимо значення медіани: Me= . Нижня межа медіанного інтервалу x0=20, його ширина h=5. Частота медіанного інтервалу = 10, кумулятивна частота передмедіанного інтервалу =8. Таким чином, Me= =22 (роки). Отже, половина студентів групи мають вік до 22 років, а інша половина – більше 22 років. Так як ( ), то маємо правосторонню асиметрію розподілу. Перевіримо рівність . , отже, даний ряд розподілу є помірно асиметричним. Задача 2. Використовуючи дані попередньої задачі, зробимо висновки щодо однорідності досліджуваної сукупності і асиметричності розподілу. Розв`язок задачі. Для цього побудуємо табл.5.5. Таблиця 5.5 Розрахунок показників варіації віку студентів
Використовуючи визначене в попередній задачі значення р., останню графу таблиці 5.4 будемо заповнювати таким чином. В першому інтервалі (до 20 років): = 200 і т.д. Для висновку щодо однорідності досліджуваної сукупності визначимо квадратичний коефіцієнт варіації: . Середнє квадратичне відхилення для згрупованих даних розрахуємо за відповідною формулою: . Отже, використовуючи дані табл.5.4: = 4,6 (р.) Отже, значення віку студентів групи відрізняються від середнього значення ( =22,5 р.) в середньому на 4,6 р. Квадратичний коефіцієнт варіації становитиме: =20,4%, що свідчить про однорідність досліджуваної сукупності. Визначимо коефіцієнт асиметрії: As = = =0,26. Оскільки As>0, то можемо зробити висновок про правосторонню асиметрію. Задача 3. За наведеними в табл.5.6 даними визначте коефіцієнти локалізації і концентрації, оцініть нерівномірність розподілу оптового товарообороту суб`єктів оптової торгівлі. Таблиця 5.6 Групування підприємств Житомирської області за обсягом оптового товарообороту
Розв`язок задачі. Оцінка нерівномірності розподілу значень ознаки між окремими складовими сукупностей ґрунтується на порівнянні часток двох розподілів – за кількістю елементів сукупності dj та за обсягом значень ознаки Dj. В нашому випадку dj – це частка j-ї класифікаційної групи підприємств у загальній їх кількості, Dj – частка оптового обороту j-ї групи підприємств у загальному обсязі обороту. Для обчислення коефіцієнтів локалізації (Lj) і концентрації (K) побудуємо табл.5.7. Таблиця 5.7 Розрахунок коефіцієнтів нерівномірності розподілу оптового товарообороту суб`єктів оптової торгівлі
Отже, можемо зробити висновок, що значні обсяги оптового товарообороту сконцентровані на підприємствах останньої класифікаційної групи (понад 50 млн.грн), про що свідчить найбільший коефіцієнт локалізації Lj =36,8. Розрахуємо значення коефіцієнту концентрації: K = =0,734. Оскільки значення K можуть коливатися в межах від 0 до 1, то K=0,734 свідчить про достатньо високий ступінь концентрації обсягу оптового товарообороту за підприємствами, що займаються оптовою торгівлею. Задача 4. Відомі такі дані про структуру відправлення (перевезення) пасажирів за видами транспорту в Чернігівській області (табл.5.8): Таблиця 5.8 Структура перевезення пасажирів за видами транспорту
Проаналізуйте інтенсивність структурних зрушень за допомогою квадратичного коефіцієнта структурних зрушень. Розв`язок задачі. Проведемо необхідні розрахунки зміни часток, які занесемо в табл.5.9. Таблиця 5.9 Структура і структурні зрушення перевезення пасажирів за видами транспорту
Отже, найбільші зміни відбулися за цей період часу у частці перевезень тролейбусним транспортом (вона зменшилася на 9 п.п.). Визначимо квадратичний коефіцієнт структурних зрушень: ; m=3, оскільки маємо структуру за трьома видами транспорту. Отже, = 7,1. Таким чином, структура перевезення пасажирів за видами транспорту (частки окремих видів транспорту) в Чернігівській області змінилася за цей період часу в середньому на 7,1 п.п. Задача 5. Вартість однокімнатних квартир-новобудов, що пропонувалися в одному з районів міста, різної загальної площі характеризується такими даними:
Визначте внутрішньогрупові, міжгрупову та загальну дисперсії вартості однокімнатних квартир-новобудов, а також питому вагу міжгрупової дисперсії у загальній. Зробіть відповідні висновки. Розв`язок задачі. Варіація вартості квартир для кожної їх групи визначається трьома внутрішньогруповими дисперсіями (маємо три групи квартир). Для першої групи квартир внутрішньогрупова дисперсія становитиме: 492,785. Для другої групи квартир: 488,5, для третьої – 158,7. Середня з групових (внутрішньогрупових) дисперсій становитиме: 414,37. Визначимо міжгрупову дисперсію: 619,0. Загальну дисперсію можемо визначити за правилом складання дисперсій як суму міжгрупової дисперсії і середньої з внутрішньогрупових дисперсій: 1033,37. Також можемо обчислити загальну дисперсію за формулою . В такому випадку: - =1033,37. Питому вага міжгрупової дисперсії у загальній становить: = =0,599 або 59,9%. Отже, варіація вартості однокімнатних квартир-новобудов майже на 60% пояснюється (обумовлена) варіацією їх загальної площі і на 100-60=40% - варіацією інших факторів (які не були враховані в групуванні).
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|