Здавалка
Главная | Обратная связь

Формули для обчислення дисперсій



Показник Формула Примітка
Загальна дисперсія - частота ознаки
Міжгрупова дисперсія - середня результативної ознаки за кожною i-ою групою; - частота появи ознаки в i-ій групі; - номер групи
Середня з внутрішньогрупових дисперсій - внутрішньогрупова дисперсія або дисперсія i-ої групи

Між видами дисперсій існує взаємозв'язок, називаний правилом складання дисперсій:

= + .

Це правило використовується в статистиці для визначення міри тісноти зв'язку між ознаками, що вивчаються.

Приклад 1

За даними типового завдання, розглянутого у темі «Узагальнюючі статистичні показники», визначаються показники варіації.

Група підприє-мств за чисель-ністю робітників, осіб x Кількість підпри-ємств f Група підприємств за чисельністю робітників, осіб x xf
100-200 150-510= =-360
200-300 -260
300-400 -160
400-500 -60
500-600 +40
600-700 +140
700-800 +240
Підсумок - =40800 - - = 1232000

Обчисляється таке.

1. Розмах варіації: ; осіб

2. Середнє квадратичне відхилення, зважене звичайним методом за формулою:

.

Розраховується середня за формулою арифметичної зваженої:

.

Необхідні обчислення зробити в таблиці, підставити їх у формули:

осіб;

особи.

Звідси , тобто це дисперсія.

3. Коефіцієнт варіації:

,

.

Середня чисельність робітників на підприємствах регіон ( осіб) відхиляється від чисельності робітників в окремих групах (x) в середньому на 124 особи ( ), або 24,8%. Тобто середня є типовою, а сукупність – якісно однорідною.

Приклад 2

Є аналітичне групування залежності середньої заробітної плати робітників від віку.

Група робітників за віком, років Число робітни-ків, fi Середня заробітна плата, грн., у
до 20,0 280, 320, 360, 350, 290
20,0 – 30,0 420, 400, 510, 490, 380, 440, 480,500
30 і старше 570, 600, 680, 630, 560, 440, 620
Усього  

Визначити: 1) загальну, міжгрупову і середню з внутрішньогрупових дисперсій; 2) перевірити правило складання дисперсій.

Загальна дисперсія по заробітній платі розраховується за формулою простої дисперсії: ,

де середня заробітна плата всіх робітників;

грн.,

13450.

Міжгрупова дисперсія:

11700,

де - середня зарплата в i-ій групі, представлена в таблиці.

Середня з внутрішньогрупових дисперсій. Розраховуються дисперсії в кожній групі:

;

2025;

Середня з внутрішньогрупових дисперсій:

.

Правило складання дисперсій: = + ;13450 = 11700 + 1750.

Необхідно звернути увагу на те, що у співставленні варіант і частот виявляється закономірність розподілу. Індивідуальними характеристиками ряду розподілу є абсолютна чисельність одиниць в окремій групі – f, а також відносні величини частот – частості:

Додатковою характеристикою варіаційних рядів є кумулятивна частота, яка визначена шляхом послідовних об'єднань груп і суми їх частот відповідно.

Якщо варіаційний ряд інтервальний з нерівними інтервалами, то частотні характеристики таких рядів незрівняні, і в аналізі розподілу використовують щільність розподілу (ξ) на одиницю частоти (частості):

або ,

розрахунок яких показує, як змінюється щільність зі збільшенням інтервалу.

Форма розподілу залежить від співвідношення частот і значень варіантів ознак. Розподіл може бути одно-, дво- і багатовершинним. Наявність двох і більше вершин свідчить про неоднорідність сукупності. Розподіл якісно однорідних сукупностей, як правило, одновершинний, серед яких є симетричні і асиметричні (скошені).

Простою мірою асиметрії є відхилення між середньою арифметичною, медіаною (Ме) та модою (Мо).

При симетричному розподілі характеристики мають однакові значення, тобто

.

При асиметричному розподілі між ними існують певні відмінності:

при правосторонній асиметрії

;

при лівосторонній асиметрії

.

Стандартизовані відхилення або

характеризують напрям і міру скошеності (асиметрію):

А=0 розподіл симетричний;

А>0 правостороння асиметрія;

А<0 лівостороння асиметрія.

Як узагальнюючі характеристики розподілу використовують моменти (m), які бувають:

а) первинні, коли а = 0; б) центральні, коли а = .

Міра при розрахунку моментів визначає порядок моменту (першого, другого і т.д. порядків).

На основі розрахунку центральних моментів третього і четвертого порядків обчислюють для характеристики форм розподілу:

стандартизованный коефіцієнт асиметрії

,

коефіцієнт ексцесу

,

де m 3 и m 4 - центральні моменти відповідно третього і четвертого порядків.

Якщо:

А>0,5 , асиметрія висока;

А < 0,5 - середня;

А< 0,25 - низька.

Якщо:

Е = 3, розподіл симетричний, близький до нормального;

Е >3 - гостровершинний;

Е <3 - плосковершинний.

Оцінка концентрації розподілу відбувається на основі розрахунку коефіцієнта концентрації:

.

При К = 0 розподіл рівномірний, К = 1 - при повній концентрації. У інших випадках К буде тим більше, чим більша міра концентрації.

Приклад 3

За даними завдання, розглянутого у прикладі 1, визначається коефіцієнт асиметрії.

Група підприємств за чисельністю робітників, осіб x Кількість підприємств f
-3
-2
-1
Підсумок - - = 152

 

При розв’язанні прикладу 3 у темі «Узагальнюючі статистичні показники» було визначено: осіб; осіб; . Визначається середнє квадратичне відхилення, застосовуючи метод моментів, за формулою:

.

Для обчислення необхідні обчислення розміщаються в таблиці (А = 450; i = 100):

;

особи.

Визначається коефіцієнт асиметрії за формулою:

.

Ступінь асиметрії оцінюють за значенням Кас, який змінюється від -3 до +3:

при симетричному (нормальному) розподілі , тобто Кас =0;

при більше моди, тобто, наявна правостороння асиметрія;

при менше моди, тобто наявна лівостороння асиметрія.

У даному ряді розподілу наявна незначна правостороння асиметрія.

Завдання 5.1

У результаті 4% вибіркового обстеження комерційних банків щодо розміру прибутку за рік отримано такий розподіл.

Розмір прибутку, млн. грн. Кількість банків
4,7-5,6
5,6-6,5
6,5-7,4
7,4-8,3
більше 8,3
Разом

За даними вибіркового спостереження визначити:

- середній розмір прибутку банку;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.2

Проведено 5% вибіркове обстеження комерційних фірм щодо витрат на рекламу в газеті «Імідж». Результати представлено у таблиці.

Група фірм за витратами на рекламу, ум. грош. од. Кількість фірм
до 15
15-20
20-25
25-30
30 і більш
Разом

За даними вибіркового обстеження обчислити:

- середній розмір витрат на рекламу фірмою;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

- Зробити висновки.

Завдання 5.3

Для вивчення тривалості користування кредитом проведене 2% вибіркове обстеження підприємств за методом випадкового безповторного відбору.

Результати обстеження показали такий розподіл підприємств за тривалістю користування кредитом.

Група підприємств за тривалістю користування кредитом, дні Кількість підприємств
до 35
35-40
40-45
45-50
більше 50
Разом

За даними вибіркового спостереження визначити:

- середню тривалість користування кредитом;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.4

Для визначення середньої суми внеску в ощадбанках району, що має 9000 вкладників, проведена 10% механічна вибірка, результати якої представлено у таблиці.

Група вкладів за розміром, тис. грн. Число вкладників, осіб
до 2
2-4
4-6
6-8
8 і більше
Разом

За даними вибіркового обстеження обчислити:

- середній розмір внеску;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.5

Для вивчення вікової структури робітників фірми за станом на 1 липня було проведено 5% вибіркове обстеження методом випадкового безповторного відбору.

Результати обстеження показали такий розподіл робітників за віком.

Група робітників за віком, років Чисельність робітників, осіб
до 20
20-30
30-40
40-50
50 років і старше
Разом

На підставі даних вибіркового обстеження обчислити:

- середній вік робітника;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.6

Для вивчення норм виробітку робітників-верстатників на підприємстві було проведено 10% вибіркове спостереження.

У механічному порядку обстежено 400 робітників, які показали витрати часу на обробку деталі.

Витрат часу на одну деталь, хв. Чисельність робітників, осіб
до 14
14-16
16-18
18-20
20 і вище
Разом

За даними вибіркового спостереження визначити:

- середні витрати часу на обробку однієї деталі;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.7

З метою контролю якості продукції проведено вибіркове обстеження партії готових виробів. При механічному (безповторному) способі відбору 5% виробів встановлено, що 20 одиниць віднесено до нестандартної продукції, а розподіл вибіркової сукупності за вагою виявився таким.

Вага виробу, г Кількість зразків, од.
до 300
300-320
320-340
340-360
більше 360
Разом

На підставі вибіркових даних обчислити:

- середню вагу виробу;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.8

Для визначення середнього відсотка виконання норми вироблення на підприємстві була проведена 10% механічна вибірка, результати якої представлено в таблиці.

Відсоток виконання норми виробітку Чисельність робітників, осіб
до 90
90-100
100-110
110-120
120-130
Разом

За даними вибіркового обстеження обчислити:

- середній відсоток виконання норми виробітку одним робітником;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.9

Для визначення середнього доходу на одного члена сім'ї в районі було проведено 5% вибіркове обстеження методом випадкового безповторного відбору. Результати обстеження показали такий розподіл населення за доходами на одного члена сім'ї.

Доход, грн. Питома вага групи в загальній чисельності населення, у %
До 800 20,0
800-1000 25,0
1000-1200 30,0
1200 і вище 25,0
Разом 100,0

За даними вибіркового обстеження визначити:

- середній дохід на одного члена сім'ї;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.10

У результаті вибіркового аналізу 50 проб цукру, який надійшов в торгівельну мережу регіону, встановлена довжина кристалів (мм).

Довжина кристалів, мм Кількість проведених проб
до 1,2
1,2-1,5
1,5-1,8
1,8 і довше

На основі даних за варіантами обчислити звичайним методом і методом моментів:

- середню довжину кристалів цукру;

- дисперсію;

- середнє квадратичне відхилення;

- коефіцієнт варіації.

Зробити висновки.

Завдання 5.11

За наведеними даними розрахувати види дисперсій за випуском продукції. Перевірити правило взаємозв'язку між дисперсіями.

Підпри-ємство Форма власності Валовий випуск продукції, тис. грн. Підприє-мство Форма власності Валовий випуск продукції, тис. грн.
Колективна Колективна
Державна Приватна
Державна Колективна
Колективна Колективна
Державна Приватна
Приватна Колективна
Колективна Колективна
Колективна Колективна
Колективна Державна
Приватна Державна

Завдання 5.12

На основі вихідних даних визначити:

- міжгрупову дисперсію результативного чинника;

- загальну дисперсію.

На основі правила складання дисперсій визначити середню з групових дисперсій.

№ п/п Витрати на 1 грн. вартості продукції, коп Фондовіддача, грн.
70,5 1,25
69,4 1,34
80,0 1,20
66,8 1,52
70,1 1,42
65,0 1,50
79,2 1,36
68,4 1,56
70,3 1,40
74,6 1,48

 

ТЕСТИ

1. Який з показників варіації дає найбільш порівнянну абсолютну оцінку варіації ознаки?

1) Лінійне відхилення.

2) Середнє квадратичне відхилення.

3) Коефіцієнт варіації.

2. Дисперсія зважена:

1) ; 2) ; 3) .

3. Середнє квадратичне відхилення зважене?

1) ; 2) ; 3)

4. Середнє квадратичне відхилення просте?

1) ; 2) ; 3) .

 

5. У яких одиницях вимірюється коефіцієнт варіації?

1) Грошова одиниця.

2) Відсотки.

3) Що й варіююча ознака.

4) Коефіцієнти.

6. Який показник визначається за формулою: ?

1) Загальна дисперсія.

2) Середня з внутрішньогрупових дисперсій.

3) Міжгрупова дисперсія.

4) Коефіцієнт асиметрії.

7. Який показник визначається за формулою ?

1) Загальна дисперсія.

2) Міжгрупова дисперсія.

3) Середня з групових дисперсій.

4) Коефіцієнт асиметрії.

8. Який показник визначається за формулою ?

1) Середнє лінійне відхилення.

2) Розмах варіації.

3) Дисперсія альтернативної ознаки.

4) Середня альтернативної ознаки.

9. Який показник можна визначити за формулою ?

1) Розмах варіації.

2) Дисперсія.

3) Середнє лінійне відхилення просте.

4) Середнє квадратичне відхилення зважене.

10. Вказати формулу спрощеного способу розрахунку дисперсії.

1) ; 2) ; 3) ; 4) .


Тема 6. СТАТИСТИЧНІ МЕТОДИ ВИМІРЮВАННЯ ВЗАЄМОЗВ'ЯЗКІВ

Усі явища у суспільному житті існують не ізольовано, а у нерозривному зв'язку, тобто залежать одне від одного. При цьому виділяються факторні (х) і результативні (у) ознаки.

Для кількісних ознак залежності між окремими явищами можуть бути:

- функціональними, коли певному значенню однієї змінної, чиннику (х), відповідає певне значення результативної ознаки (у);

- кореляційними (статистичними), коли із зміною факторної ознаки (х) змінюються групові середні результативної ознаки (у).

Основним моментом у вивченні зв'язків між явищами є встановлення їх суті на основі пізнання якісних характеристик явищ, їх зв'язків.

Наявність або відсутність зв'язків можна виявити, використовуючи:

▪ метод аналітичних групувань;

▪ графічний метод;

▪ побудову та аналіз кореляційних таблиць;

▪ кореляційний аналіз.

У кореляційно-регресійному аналізі лінії регресії відображають не окремими точками, як в аналітичних групуваннях, а в кожній точці інтервалу зміни факторного значення (х). Лінія регресії зображується у вигляді певної функції: у = f(x), яка називається рівнянням регресії, де у – теоретичне значення результативної ознаки.

Серед безлічі функцій найбільш поширеною у статистичному аналізі є лінійна , що пояснюється її простотою і змістовністю.

Для визначення за даними парної кореляції параметрів лінійної регресії треба розв’язати систему нормальних рівнянь для знаходження параметрів а і b:

.

Інколи для знаходження параметрів а і b використовують спосіб визначників:

;

або ; .

Після знаходження параметрів (а і b), це вже рівняння не регресії, а кореляційне, яке можна використовувати в прогнозуванні результативної ознаки (у) при певному значенні чинника (х): . Методику розрахунків викладено в таблиці.

№ п/п Дохід від реалізац, тис. грн. х Витрати обігу тис. грн. у х2 ху у2 Вирівняне (теоретично) значення витрат обігу, тис. грн.
           
 

Виміряти щільність зв'язку між корелюючими величинами (х и у) можна за допомогою кореляційного відношення (η) і коефіцієнта кореляції (r).

1. Кореляційне відношення застосовне до всіх випадків кореляційної залежності, незалежно від форми цього зв'язку. Загальний вигляд формули кореляційного відношення:

,

де η - кореляційне відношення;

η2 - коефіцієнт детермінації.

В основі числення цих показників лежить правило додавання дисперсій, згідно з яким загальна дисперсія (σ2) дорівнює сумі міжгрупової ( ) і середньої з групових дисперсій ( ):

σ2= + ,

де - загальна дисперсія, що характеризує вплив усіх чинників на результативну ознаку (у);

- міжгрупова дисперсія, що характеризує вплив чинника (х), який вивчається, на результативну ознаку (у);

- середня з групових дисперсій, яка характеризує вплив інших чинників на результативну ознаку (у);

- загальна середня;

- групові середні;

n - число даних, які обстежують в цілому;

fi - число обстежених одиниць у кожній групі;

.

Кореляційне відношення може бути обчислене як:

емпіричне, на основі фактичних даних:

теоретичне, що обчислюється після знаходження параметрів (а і b), тобто після розв’язання функцій і знаходження теоретичних (вирівняних) значень результативної ознаки ( ):

,

де - дисперсія теоретичних значень результативної ознаки, що характеризує міру впливу факторної ознаки (х) на результативну ( ); - теоретичне значення результативної ознаки, вирівняне.

Оскільки:

,

де – залишкова дисперсія, то ηТ може бути обчислено за формулою

і носитиме назву в цьому випадку індексу кореляції.

Чим ближче значення η до 1, тим вища, щільніша залежність між у та х. Чим ближче η до 0, тим залежність менша.

При:

η < 0,3 говорять про слабку залежність між корельованими величинами;

0,3 < η <0,6 говорять про середню щільність зв'язку між х і у;

η > 0,6 говорять про високу (істотну) залежність.

2. Лінійний коефіцієнт кореляції (r), який використовується як показник тісноти зв'язку лише при лінійному зв'язку між х і у.

Його можна обчислити за формулами:

,

де r - коефіцієнт кореляції, значення якого коливається від -1 до +1 і характеризує не лише тісноту зв'язку, але і його напрям (“-” - обернена залежність, “+” - пряма залежність між х і у );

 

; ; ;

; ;

;

n - кількість ознак.

Для якісної оцінки щільності зв'язку використовують таблицю Чеддока.

Значення коефіцієнта кореляції 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика тісноти зв'язки слабка помірна помітна висока дуже висока

З суті щільності зв'язку випливає, що чисельне значення може знаходитися лише в межах ±1. Близькість до 1 коефіцієнта кореляції говорить про близькість до функціональної залежності, а близькість до 0 - про слабку залежність.

Приклад 1

З 12 підприємств отримано дані про річну продуктивність праці робітника (тис. грн.) і озброєність праці основним капіталом (тис. грн. /особу.).

На підставі приведених даних: 1) оцінити щільність зв'язку між показниками за допомогою коефіцієнта Фехнера і коефіцієнта рангової кореляції Спірмена; 2) виявити залежність і тісноту зв'язку між показниками за допомогою парного кореляційно-регресійного аналізу. Зробити висновки.

Вихідні дані та необхідні для розв’язання прикладу розрахунки викласти в табл. 1 та табл. 2.

1. Для визначення коефіцієнта Фехнера розраховуються середні значення ознак:

тис. грн/ос., тис. грн.

Визначають знаки відхилень від середньої, тобто знаки та ,і заносять в таблицю (гр. 3 та 4), а потім підраховують число співпадань і не співпадань знаків відхилень (гр. 5). Тоді: . Коефіцієнт, який дорівнює 0,5, свідчить про наявність прямої і помірної залежності між продуктивністю та капіталоозброєністю праці.

Для визначення коефіцієнта рангової кореляції Спірмена ( ) проранжовують в порядку зростання факторну і результативну ознаки, тобто визначають Rх и Rу і заносять їх у гр. 6 и 7 таблиці 1. Потім розраховують і заносять у гр. 8 таблиці. Коефіцієнт рангової кореляції Спірмена буде дорівнювати:

.

Щільність зв'язку між аналізованими показниками пряма і досить тісна.

Розрахункова таблиця для визначення непараметричних показників щільності зв'язку

№ під-п­ри­ємства Капітало­озброєність праці, тис. грн/осіб, х Річна продук­тивність праці, тис. грн., у Знак відхилення від середньої Число співпадань (неспівпа­дань) знаків Ранг  
факторна ознака результа-тивна ознака за х Rx за у Rу
А
360,0 15,2 + + С
298,0 12,8 - - С
328,0 13,8 - Н
330,0 14,0 + С
366,0 16,3 + + С
316,0 12,6 - - С
334,0 13,2 + - Н
300,0 12,9 - - С
314,0 13,1 - - С
320,0 12,5 - - С
362,0 15,7 + + С
332,0 13,5 + - Н
Усьо-го 3960,0 165,6          

На першому етапі вживання методики парного кореляційного аналізу перевіряють, чи виконуються вимоги, що ставляться до факторної і результативної ознак.

Однорідність розподілів. Усі проміжні розрахунки представлені в наступній таблиці.

; ;

;

; .

Коефіцієнти варіації ( и ) менше 33%, що підтверджує гіпотезу про статистичну однорідність капіталоозброєності і продуктивності праці.

Вибирається форма зв'язку між ознаками. Для цього будується кореляційне поле (рис. 3).

За розміщенням точок на кореляційному полі вибирається лінійна форма зв'язку, тобто рівняння зв'язку буде: .







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.