Формули для обчислення дисперсій
Між видами дисперсій існує взаємозв'язок, називаний правилом складання дисперсій: = + . Це правило використовується в статистиці для визначення міри тісноти зв'язку між ознаками, що вивчаються. Приклад 1 За даними типового завдання, розглянутого у темі «Узагальнюючі статистичні показники», визначаються показники варіації.
Обчисляється таке. 1. Розмах варіації: ; осіб 2. Середнє квадратичне відхилення, зважене звичайним методом за формулою: . Розраховується середня за формулою арифметичної зваженої: . Необхідні обчислення зробити в таблиці, підставити їх у формули: осіб; особи. Звідси , тобто це дисперсія. 3. Коефіцієнт варіації: , . Середня чисельність робітників на підприємствах регіон ( осіб) відхиляється від чисельності робітників в окремих групах (x) в середньому на 124 особи ( ), або 24,8%. Тобто середня є типовою, а сукупність – якісно однорідною. Приклад 2 Є аналітичне групування залежності середньої заробітної плати робітників від віку.
Визначити: 1) загальну, міжгрупову і середню з внутрішньогрупових дисперсій; 2) перевірити правило складання дисперсій. Загальна дисперсія по заробітній платі розраховується за формулою простої дисперсії: , де середня заробітна плата всіх робітників; грн., 13450. Міжгрупова дисперсія: 11700, де - середня зарплата в i-ій групі, представлена в таблиці. Середня з внутрішньогрупових дисперсій. Розраховуються дисперсії в кожній групі: ; 2025; Середня з внутрішньогрупових дисперсій: . Правило складання дисперсій: = + ;13450 = 11700 + 1750. Необхідно звернути увагу на те, що у співставленні варіант і частот виявляється закономірність розподілу. Індивідуальними характеристиками ряду розподілу є абсолютна чисельність одиниць в окремій групі – f, а також відносні величини частот – частості: Додатковою характеристикою варіаційних рядів є кумулятивна частота, яка визначена шляхом послідовних об'єднань груп і суми їх частот відповідно. Якщо варіаційний ряд інтервальний з нерівними інтервалами, то частотні характеристики таких рядів незрівняні, і в аналізі розподілу використовують щільність розподілу (ξ) на одиницю частоти (частості): або , розрахунок яких показує, як змінюється щільність зі збільшенням інтервалу. Форма розподілу залежить від співвідношення частот і значень варіантів ознак. Розподіл може бути одно-, дво- і багатовершинним. Наявність двох і більше вершин свідчить про неоднорідність сукупності. Розподіл якісно однорідних сукупностей, як правило, одновершинний, серед яких є симетричні і асиметричні (скошені). Простою мірою асиметрії є відхилення між середньою арифметичною, медіаною (Ме) та модою (Мо). При симетричному розподілі характеристики мають однакові значення, тобто . При асиметричному розподілі між ними існують певні відмінності: при правосторонній асиметрії ; при лівосторонній асиметрії . Стандартизовані відхилення або характеризують напрям і міру скошеності (асиметрію): А=0 розподіл симетричний; А>0 правостороння асиметрія; А<0 лівостороння асиметрія. Як узагальнюючі характеристики розподілу використовують моменти (m), які бувають: а) первинні, коли а = 0; б) центральні, коли а = . Міра при розрахунку моментів визначає порядок моменту (першого, другого і т.д. порядків). На основі розрахунку центральних моментів третього і четвертого порядків обчислюють для характеристики форм розподілу: стандартизованный коефіцієнт асиметрії , коефіцієнт ексцесу , де m 3 и m 4 - центральні моменти відповідно третього і четвертого порядків. Якщо: А>0,5 , асиметрія висока; А < 0,5 - середня; А< 0,25 - низька. Якщо: Е = 3, розподіл симетричний, близький до нормального; Е >3 - гостровершинний; Е <3 - плосковершинний. Оцінка концентрації розподілу відбувається на основі розрахунку коефіцієнта концентрації: . При К = 0 розподіл рівномірний, К = 1 - при повній концентрації. У інших випадках К буде тим більше, чим більша міра концентрації. Приклад 3 За даними завдання, розглянутого у прикладі 1, визначається коефіцієнт асиметрії.
При розв’язанні прикладу 3 у темі «Узагальнюючі статистичні показники» було визначено: осіб; осіб; . Визначається середнє квадратичне відхилення, застосовуючи метод моментів, за формулою: . Для обчислення необхідні обчислення розміщаються в таблиці (А = 450; i = 100): ; особи. Визначається коефіцієнт асиметрії за формулою: . Ступінь асиметрії оцінюють за значенням Кас, який змінюється від -3 до +3: при симетричному (нормальному) розподілі , тобто Кас =0; при більше моди, тобто, наявна правостороння асиметрія; при менше моди, тобто наявна лівостороння асиметрія. У даному ряді розподілу наявна незначна правостороння асиметрія. Завдання 5.1 У результаті 4% вибіркового обстеження комерційних банків щодо розміру прибутку за рік отримано такий розподіл.
За даними вибіркового спостереження визначити: - середній розмір прибутку банку; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.2 Проведено 5% вибіркове обстеження комерційних фірм щодо витрат на рекламу в газеті «Імідж». Результати представлено у таблиці.
За даними вибіркового обстеження обчислити: - середній розмір витрат на рекламу фірмою; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. - Зробити висновки. Завдання 5.3 Для вивчення тривалості користування кредитом проведене 2% вибіркове обстеження підприємств за методом випадкового безповторного відбору. Результати обстеження показали такий розподіл підприємств за тривалістю користування кредитом.
За даними вибіркового спостереження визначити: - середню тривалість користування кредитом; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.4 Для визначення середньої суми внеску в ощадбанках району, що має 9000 вкладників, проведена 10% механічна вибірка, результати якої представлено у таблиці.
За даними вибіркового обстеження обчислити: - середній розмір внеску; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.5 Для вивчення вікової структури робітників фірми за станом на 1 липня було проведено 5% вибіркове обстеження методом випадкового безповторного відбору. Результати обстеження показали такий розподіл робітників за віком.
На підставі даних вибіркового обстеження обчислити: - середній вік робітника; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.6 Для вивчення норм виробітку робітників-верстатників на підприємстві було проведено 10% вибіркове спостереження. У механічному порядку обстежено 400 робітників, які показали витрати часу на обробку деталі.
За даними вибіркового спостереження визначити: - середні витрати часу на обробку однієї деталі; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.7 З метою контролю якості продукції проведено вибіркове обстеження партії готових виробів. При механічному (безповторному) способі відбору 5% виробів встановлено, що 20 одиниць віднесено до нестандартної продукції, а розподіл вибіркової сукупності за вагою виявився таким.
На підставі вибіркових даних обчислити: - середню вагу виробу; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.8 Для визначення середнього відсотка виконання норми вироблення на підприємстві була проведена 10% механічна вибірка, результати якої представлено в таблиці.
За даними вибіркового обстеження обчислити: - середній відсоток виконання норми виробітку одним робітником; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.9 Для визначення середнього доходу на одного члена сім'ї в районі було проведено 5% вибіркове обстеження методом випадкового безповторного відбору. Результати обстеження показали такий розподіл населення за доходами на одного члена сім'ї.
За даними вибіркового обстеження визначити: - середній дохід на одного члена сім'ї; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.10 У результаті вибіркового аналізу 50 проб цукру, який надійшов в торгівельну мережу регіону, встановлена довжина кристалів (мм).
На основі даних за варіантами обчислити звичайним методом і методом моментів: - середню довжину кристалів цукру; - дисперсію; - середнє квадратичне відхилення; - коефіцієнт варіації. Зробити висновки. Завдання 5.11 За наведеними даними розрахувати види дисперсій за випуском продукції. Перевірити правило взаємозв'язку між дисперсіями.
Завдання 5.12 На основі вихідних даних визначити: - міжгрупову дисперсію результативного чинника; - загальну дисперсію. На основі правила складання дисперсій визначити середню з групових дисперсій.
ТЕСТИ 1. Який з показників варіації дає найбільш порівнянну абсолютну оцінку варіації ознаки? 1) Лінійне відхилення. 2) Середнє квадратичне відхилення. 3) Коефіцієнт варіації. 2. Дисперсія зважена: 1) ; 2) ; 3) . 3. Середнє квадратичне відхилення зважене? 1) ; 2) ; 3) 4. Середнє квадратичне відхилення просте? 1) ; 2) ; 3) .
5. У яких одиницях вимірюється коефіцієнт варіації? 1) Грошова одиниця. 2) Відсотки. 3) Що й варіююча ознака. 4) Коефіцієнти. 6. Який показник визначається за формулою: ? 1) Загальна дисперсія. 2) Середня з внутрішньогрупових дисперсій. 3) Міжгрупова дисперсія. 4) Коефіцієнт асиметрії. 7. Який показник визначається за формулою ? 1) Загальна дисперсія. 2) Міжгрупова дисперсія. 3) Середня з групових дисперсій. 4) Коефіцієнт асиметрії. 8. Який показник визначається за формулою ? 1) Середнє лінійне відхилення. 2) Розмах варіації. 3) Дисперсія альтернативної ознаки. 4) Середня альтернативної ознаки. 9. Який показник можна визначити за формулою ? 1) Розмах варіації. 2) Дисперсія. 3) Середнє лінійне відхилення просте. 4) Середнє квадратичне відхилення зважене. 10. Вказати формулу спрощеного способу розрахунку дисперсії. 1) ; 2) ; 3) ; 4) . Тема 6. СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ВЗАЄМОЗВ'ЯЗКІВ Усі явища у суспільному житті існують не ізольовано, а у нерозривному зв'язку, тобто залежать одне від одного. При цьому виділяються факторні (х) і результативні (у) ознаки. Для кількісних ознак залежності між окремими явищами можуть бути: - функціональними, коли певному значенню однієї змінної, чиннику (х), відповідає певне значення результативної ознаки (у); - кореляційними (статистичними), коли із зміною факторної ознаки (х) змінюються групові середні результативної ознаки (у). Основним моментом у вивченні зв'язків між явищами є встановлення їх суті на основі пізнання якісних характеристик явищ, їх зв'язків. Наявність або відсутність зв'язків можна виявити, використовуючи: ▪ метод аналітичних групувань; ▪ графічний метод; ▪ побудову та аналіз кореляційних таблиць; ▪ кореляційний аналіз. У кореляційно-регресійному аналізі лінії регресії відображають не окремими точками, як в аналітичних групуваннях, а в кожній точці інтервалу зміни факторного значення (х). Лінія регресії зображується у вигляді певної функції: у = f(x), яка називається рівнянням регресії, де у – теоретичне значення результативної ознаки. Серед безлічі функцій найбільш поширеною у статистичному аналізі є лінійна , що пояснюється її простотою і змістовністю. Для визначення за даними парної кореляції параметрів лінійної регресії треба розв’язати систему нормальних рівнянь для знаходження параметрів а і b: . Інколи для знаходження параметрів а і b використовують спосіб визначників: ; або ; . Після знаходження параметрів (а і b), це вже рівняння не регресії, а кореляційне, яке можна використовувати в прогнозуванні результативної ознаки (у) при певному значенні чинника (х): . Методику розрахунків викладено в таблиці.
Виміряти щільність зв'язку між корелюючими величинами (х и у) можна за допомогою кореляційного відношення (η) і коефіцієнта кореляції (r). 1. Кореляційне відношення застосовне до всіх випадків кореляційної залежності, незалежно від форми цього зв'язку. Загальний вигляд формули кореляційного відношення: , де η - кореляційне відношення; η2 - коефіцієнт детермінації. В основі числення цих показників лежить правило додавання дисперсій, згідно з яким загальна дисперсія (σ2) дорівнює сумі міжгрупової ( ) і середньої з групових дисперсій ( ): σ2= + , де - загальна дисперсія, що характеризує вплив усіх чинників на результативну ознаку (у); - міжгрупова дисперсія, що характеризує вплив чинника (х), який вивчається, на результативну ознаку (у); - середня з групових дисперсій, яка характеризує вплив інших чинників на результативну ознаку (у); - загальна середня; - групові середні; n - число даних, які обстежують в цілому; fi - число обстежених одиниць у кожній групі; . Кореляційне відношення може бути обчислене як: емпіричне, на основі фактичних даних: теоретичне, що обчислюється після знаходження параметрів (а і b), тобто після розв’язання функцій і знаходження теоретичних (вирівняних) значень результативної ознаки ( ): , де - дисперсія теоретичних значень результативної ознаки, що характеризує міру впливу факторної ознаки (х) на результативну ( ); - теоретичне значення результативної ознаки, вирівняне. Оскільки: , де – залишкова дисперсія, то ηТ може бути обчислено за формулою і носитиме назву в цьому випадку індексу кореляції. Чим ближче значення η до 1, тим вища, щільніша залежність між у та х. Чим ближче η до 0, тим залежність менша. При: η < 0,3 говорять про слабку залежність між корельованими величинами; 0,3 < η <0,6 говорять про середню щільність зв'язку між х і у; η > 0,6 говорять про високу (істотну) залежність. 2. Лінійний коефіцієнт кореляції (r), який використовується як показник тісноти зв'язку лише при лінійному зв'язку між х і у. Його можна обчислити за формулами: , де r - коефіцієнт кореляції, значення якого коливається від -1 до +1 і характеризує не лише тісноту зв'язку, але і його напрям (“-” - обернена залежність, “+” - пряма залежність між х і у );
; ; ; ; ; ; n - кількість ознак. Для якісної оцінки щільності зв'язку використовують таблицю Чеддока.
З суті щільності зв'язку випливає, що чисельне значення може знаходитися лише в межах ±1. Близькість до 1 коефіцієнта кореляції говорить про близькість до функціональної залежності, а близькість до 0 - про слабку залежність. Приклад 1 З 12 підприємств отримано дані про річну продуктивність праці робітника (тис. грн.) і озброєність праці основним капіталом (тис. грн. /особу.). На підставі приведених даних: 1) оцінити щільність зв'язку між показниками за допомогою коефіцієнта Фехнера і коефіцієнта рангової кореляції Спірмена; 2) виявити залежність і тісноту зв'язку між показниками за допомогою парного кореляційно-регресійного аналізу. Зробити висновки. Вихідні дані та необхідні для розв’язання прикладу розрахунки викласти в табл. 1 та табл. 2. 1. Для визначення коефіцієнта Фехнера розраховуються середні значення ознак: тис. грн/ос., тис. грн. Визначають знаки відхилень від середньої, тобто знаки та ,і заносять в таблицю (гр. 3 та 4), а потім підраховують число співпадань і не співпадань знаків відхилень (гр. 5). Тоді: . Коефіцієнт, який дорівнює 0,5, свідчить про наявність прямої і помірної залежності між продуктивністю та капіталоозброєністю праці. Для визначення коефіцієнта рангової кореляції Спірмена ( ) проранжовують в порядку зростання факторну і результативну ознаки, тобто визначають Rх и Rу і заносять їх у гр. 6 и 7 таблиці 1. Потім розраховують і заносять у гр. 8 таблиці. Коефіцієнт рангової кореляції Спірмена буде дорівнювати: . Щільність зв'язку між аналізованими показниками пряма і досить тісна. Розрахункова таблиця для визначення непараметричних показників щільності зв'язку
На першому етапі вживання методики парного кореляційного аналізу перевіряють, чи виконуються вимоги, що ставляться до факторної і результативної ознак. Однорідність розподілів. Усі проміжні розрахунки представлені в наступній таблиці. ; ; ; ; . Коефіцієнти варіації ( и ) менше 33%, що підтверджує гіпотезу про статистичну однорідність капіталоозброєності і продуктивності праці. Вибирається форма зв'язку між ознаками. Для цього будується кореляційне поле (рис. 3). За розміщенням точок на кореляційному полі вибирається лінійна форма зв'язку, тобто рівняння зв'язку буде: . ©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|