Здавалка
Главная | Обратная связь

ПОНЯТИЕ О КОРРЕЛЯЦИОННОМ И РЕГРЕССИВНОМ АНАЛИЗЕ



Существуют два вида зависимостей: функциональная и стохастическая (вероятностная). Функциональная: каждому значению одной переменной соответствует одно, определённое значение другой.

Пример 12. 1)

2)

Строгая функциональная зависимость между случайными величинами на практике встречается редко. Гораздо чаще другая, когда каждому численному значению одной случайной величины не соответствует одно, определённое значение другой.

Пример 13. Между ростом Х и весом Y человека (наугад выбранного) имеется зависимость, но она не является функциональной.

Связь между случайными величинами, имеющими общие случайные факторы, которые влияют как на одну, так и на другую случайную величину, наряду с другими, неодинаковыми для обеих случайных величин факторами, называется стохастической. В статистике её называют статистической.

 

: Определение. Статистическойназывают зависимость, при которой изменение одной случайной величины влечёт изменение распределения другой.

На рис. 8 приведены примеры функциональной и статистической зависимостей.

Статистическая (стохастическая) зависимость
Зависимость отсутствует
Функциональная зависимость

 

Рис. 8

 

Исследование взаимозависимости случайных величин рассматривается в корреляционном анализе(зависимость веса Y от роста Х – корреляционная зависимость). Исследование зависимости случайной величины от ряда неслучайных и случайных величин рассматривается в регрессионном анализе(зависимость между урожайностью сельскохозяйственных культур от природных и экономических факторов).

В корреляционном анализе оценивается сила стохастической связи, в регрессионном – исследуется её форма.

 

: Определение. Условной средней называют среднее арифметическое значение Y, соответствующее значению Х = х.

 

Пример 14. При х = 2Y приняла значения: 5, 6, 10, тогда .

: Определение. Корреляционной зависимостью Y от Х называют функциональную зависимость условной средней от х:

.(16)

 

Это уравнение регрессии Y на Х. Функцию f(x) называют регрессией Y на Х, а её график – линией регрессии Y на Х.

Аналогично: условная средняя равна среднему арифметическому значений Х, соответствующих Y = у.

Уравнение регрессии Х на Y:

(17)

где j(y) – регрессия Х на Y.

Чаще всего теоретические регрессии (16) и (17) неизвестны, и их оценивают при помощи эмпирических регрессий. Экспериментальные данные изображают в виде точек в декартовой системе координат. Исходя из характера расположения точек выбирают вид функции регрессии и её оценки, т.е. эмпирической регрессии (прямая, парабола и т.д.):

эмпирическое уравнение Y на Х. Параметры находят методом наименьших квадратов.

Аналогично .

В зависимости от числа случайных величин различают простую и множественную регрессии.

Пример 15.

1. Простая регрессия – регрессия между затратами на производстве и объёмом продукции, производимой предприятием.

2. Множественная регрессия – регрессия между производительностью труда и уровнем механизации производственных процессов, фондом рабочего времени, материалоёмкостью, квалификацией рабочих.

По форме различают линейную и нелинейную регрессии.

Линейная регрессия: ,

,

где коэффициенты регрессии.

Обе линии регрессии Y на Х и Х на Y – прямые.

Выборочное уравнение прямой линии регрессии Y на Х имеет вид:

где – условная средняя;

– выборочные средние Х и Y ;

– выборочные средние квадратические отклонения;

выборочный коэффициент корреляции.

,

где x, y – варианты;

– частота пары вариант (x, y);

– объём выборки (сумма всех частот);

коэффициент регрессии.

Аналогично определяется выборочное уравнение прямой линии регрессии Х на Y:

.


Связь коэффициентов регрессии и коэффициентов корреляции:

; ; .

Если , , то Х и Y одновременно возрастают, если < 0, < 0, то X и Y убывают. Чем меньше угол между прямыми регрессии Y на Х и Х на У, тем теснее связь между Х и Y.

Выборочный коэффициент корреляции служит для оценки тесноты линейной корреляционной зависимости.

Свойства выборочного коэффициента корреляции :

1. | |≤ 1.

2. Если = 0, то Х и Y не связаны линейной корреляционной зависимостью.

3. Если | |= 1, то Х и Y связаны функциональной зависимостью (линейной).

4. С возрастанием | | линейная корреляционная зависимость становится более тесной, при | |= 1 переходит в функциональную,

при | |→ 1 связь сильнее,

при | |→ 0 слабее.

Пример 16 (из тестов).

1. При построении уравнения парной регрессии y = α + βx + ξ были получены результаты: = 0.8; = 2; = 1,5, тогда коэффициент регрессии β равен:

-3; 0,6; -0,6; 2.

Решение.

.

Ответ: 0,6.

2. Выборочное уравнение парной регрессии имеет вид y = –3 + 2x. Тогда выборочный коэффициент корреляции может быть равен…

-3; 0,6; -0,6; 2.

Решение.

| |≤ 1 (всегда), = 2 (из условия), (всегда), следовательно, = 0,6.

Задачи _______________________________________________________ ´

1. В магазине постельных принадлежностей были проведены в течение пяти дней подсчеты числа покупок простыней X и подушек Y:

X
Y

Найти выборочное уравнение линейной регрессии Y на X и выборочный коэффициент корреляции.

2. На основании полученных по результатам измерений значений величин X и Y:

X
Y

найти выборочное уравнение линейной регрессии X на Y и выборочный коэффициент корреляции.

3. Найти выборочное уравнение линейной регрессии Y на X по данным следующей таблицы:

X
Y 1,9 2,2 2,4 2,3 2,5 2,5

4. Найти выборочное уравнение линейной регрессии X на Y по данным следующей таблицы:

X 24,5 24,5 25,5 26,5 26,5
Y 0,48 0,5 0,49 0,5 0,51 0,52 0,51 0,53 0,5 0,52 0,54 0,52 0,53

5. Найти выборочное уравнение линейной регрессии Y на X по данным следующей таблицы:

X 0,5 1,5 2,5 3,5 4,5
Y

6. В следующей таблице приведены данные о зависимости стоимости эксплуатации самолета Y (млн руб.) от его возраста X (лет):

X
Y 3,5 3,5

Найти выборочное уравнение линейной регрессии Y на X.

7. С целью анализа взаимного влияния зарплаты и текучести рабочей силы на пяти однотипных фирмах с одинаковым числом работников проведены измерения уровня месячной зарплаты X и числа уволившихся за год рабочих Y:

X
Y

Найти выборочное уравнение линейной регрессии Y на X и выборочный коэффициент корреляции.

8. В таблице приведены данные измерения веса Y и роста X двадцати курсантов школы МВД:

X
Y
X
Y

Найти выборочное уравнение линейной регрессии Y на X и выборочный коэффициент корреляции.







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.