Тема: Регресивний аналіз поштового наватаження в УДППЗ «Укрпошта» ⇐ ПредыдущаяСтр 2 из 2
У практичних дослідженнях виникає необхідність апроксимувати (описати приблизно) діаграму розсіяння математичним рівнянням. Тобто залежність між змінними величинами Y і Х можна виразити аналітично за допомогою формул і рівнянь і графічно у вигляді геометричного місця крапок в системі прямокутних координат. Графік кореляційної залежності будується по рівняннях функції і , які називаються регресією (термін “регресія” походить від латів. regressio — рух назад). Тут і — середні арифметичні з числових значень залежних змінних Y і X. Для вираження регресії служать емпіричні і теоретичні ряди, їх графіки — лінії регресії, а також кореляційні рівняння (рівняння регресії) і коефіцієнт лінійної регресії. Показники регресії виражають кореляційний зв'язок двосторонньо, враховуючи зміну середньої величини ознаки Y при зміні значень xi прізнака X, і навпаки, показують зміну середньої величини ознаки Х по змінених значеннях yi ознаки Y. Виняток становлять тимчасові ряди, або ряди динаміки, що показують зміну ознак в часі. Регресія таких рядів є однобічною. Ряди регресії, особливо їх графіки, дають наочне уявлення про форму і тісноту кореляційного зв'язку між ознаками, в чому і полягає їх цінність. Форма зв'язку між показниками, що впливають на рівень спортивного результату і загальної фізичної підготовки що займаються фізичною культурою і спортом, може бути всілякою. І тому завдання полягає в тому, щоб будь-яку форму кореляційного зв'язку виразити рівнянням певної функції (лінійною графіки, дають наочне уявлення про форму і тісноту кореляційною, параболічною і так далі), що дозволяє отримувати потрібну інформацію про кореляцію між змінними велічинаміy і X, передбачати можливі зміни ознаки Y на основі відомих змін X, пов'язаного з Y кореляційно. Парна регресія-рівняння зв'язку два змінних y і х:
y - залежна змінна (результативна ознака – обміну письмової коріспонденциї за 2009 рік, тис ед.);
Лінійна регресія: Середній коефіцієнт еластичності показує, на скільки відсотків в середньому по сукупності зміниться результат у від своєї середньої величини при зміні чинника x на 1% від свого середнього значення: - залишкова сума квадратів відхилень. F-тест - оцінювання якості рівняння регресії - полягає в перевірці гіпотези Но про статистичну незначущість рівняння регресії і показника тісноти зв'язку. Для цього виконується порівняння фактичного Fфакт і критичного (табличного) Fтабл значень F -крітерію Фішера. Нулевая гипотеза (Но) — это гипотеза о том, что есть две совокупности, которые сравниваются по одному или нескольким признакам, не отличаются. При этом предполагают, что действительное различие сравниваемых величин равно нулю, а выявленное по данным отличие от нуля несет случайный характер. Нулевая гипотеза отвергается в тех случаях, когда по выборке получается результат, который при истинности выдвинутой нулевой гипотезы маловероятен. Границей маловероятного или невозможного обычно считают а = 0,05 или 0,01; 0,001. Критерий Фишера применяется для проверки равенства дисперсий двух выборок. Его относят к критериям рассеяния.
При проверке гипотезы положения (гипотезы о равенстве средних значений в двух выборках) с использованием критерия Стьюдента имеет смысл предварительно проверить гипотезу о равенстве дисперсий. Если она верна, то для сравнения средних можно воспользоваться более мощным критерием.
В регрессионном анализе критерий Фишера позволяет оценивать значимость линейных регрессионных моделей. В частности, он используется в шаговой регрессии для проверки целесообразности включения или исключения независимых переменных (признаков) в регрессионную модель. В дисперсионном анализе критерий Фишера позволяет оценивать значимость факторов и их взаимодействия. Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных. Перед его применением рекомендуется выполнить проверку нормальности. F - критерий Фишера является параметричесикм критерием и используется для сравнения дисперсий двух вариационных рядов. Эмпирическое значение критерия вычисляется по формуле: , , где - большая дисперсия, - меньшая дисперсия рассматриваемых вариационных рядов. Если вычисленное значение критерия Fэмп больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются различными. Иными словами, проверяется гипотеза, состоящая в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: H0={Dx=Dy}. Критическое значение критерия Фишера следует определять по специальной таблице, исходя из уровня значимости α и степеней свободы числителя (n1-1) и знаменателя (n2-1). Проиллюстрируем применение критерия Фишера на следующем примере. Дисперсия такого показателя, как стрессоустойчивость для учителей составила 6,17 (n1=32), а для менеджеров 4,41 (n2=33). Определим, можно ли считать уровень дисперсий примерно одинаковым для данных выборок на уровне значимости 0,05. Для ответа на поставленный вопрос определим эмпирическое значение критерия: .При этом критическое значение критерия Fкр(0,05;31;32)=2.
Таким образом, Fэмп=1,4<2=Fкр, поэтому нулевая гипотеза о равенстве генеральных дисперсий на уровне значимости 0,05 принимается. Непараметрические критерии Непараметрические критерии не содержат расчёта параметров распределения и основаны на оперировании частотами или рангами. Непараметрические критерии, как правило, менее сложны в вычислениях и могут быть измерены в любой шкале, начиная от шкалы наименований.
Fфакт визначається із співвідношення значень факторної і залишкової дисперсій, розрахованих на одну міру свободи: m - число параметрів при змінних х.
Порівнюючи фактичне і критичне (табличне) значення t-статистики - tтабл і tфакт - приймаємо або відкидаємо гіпотезу Але. Зв'язок між f-крітерієм Фішера і t-статістікою Стьюдента виражається рівністю Якщо tтабл < tфакт те Ho відхиляється, тобто а, b і не випадково відрізняються від нуля і сформувалися під впливом систематично діючих чинника х. Якщо tтабл > tфакт те гіпотеза Но не відхиляється і признається випадкова природа формування а, b або . Для розрахунку довірчого інтервалу визначаємо граничну помилку D для кожного показника: , . Якщо в кордони довірчого інтервалу потрапляє нуль, тобто нижній кордон негативний, а верхня позитивна, то оцінюваний параметр приймається нульовим, оскільки він не може одночасно набувати і позитивного, і негативного значень. ; ; где .
Приклад аналізу обміну письмової кореспонденції в УДППЗ “Укрпочта”
Приклад розрахунку регрессивного аналізу обміну письмової кореспонденції в УДППЗ “Укрпочта”
Таблица 1.
Для розрахунку двух змінних х і у потрібно: 1. Для характеристики залежності у від х розрахувати параметри наступних функцій: а) лінійною; б) статечною (заздалегідь потрібно виробити процедуру лінеаризації змінних, шляхом логарифмування обох частин); у) показовою; г) рівносторонньої гіперболи (так само потрібно придумати як заздалегідь лінеарізовать дану модель). 2. Оцінити кожну модель через середню помилку апроксимації і f-крітерій Фішера. Приклад розрахунку la. Для розрахунку параметрів а і b лінійної регресії вирішуем систему нормальних рівнянь відносно а і b:
Таблица 1.1
Для розрахунку таблиці 1.1, потрібно: 1) Вихідні значення х і у перемножити,возвести до квадрату; 2) Визначити торбу кожного стовпця; 3) Визначити середнє значення (суму/кількість ), , , , , ; 4)Визначити 5) Для визначення σ потрібно визначити корінь з ; 6) Для розрахунку параметрів а і b лінійної регресії Використовуваний наступні формули:
С увеличением среднедневной заработной платы на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,94 %-ных пункта.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|