Здавалка
Главная | Обратная связь

Статистические функции для целей прогнозирования



Регрессионный анализ – имеет своей целью определение (идентификацию) уравнения регрессии, включая статистическую оценку его параметров. Уравнения регрессии позволяют найти среднее значение зависимой переменной, если величина независимой ( или независимых) переменной известна.

Практически речь идёт о том, чтобы, анализируя множество точек на графике, т, е. множество статистических данных, найти заключённую в этом множестве тенденцию –линию регрессии. Зная уравнение регрессии, можно использовать его для целей прогнозирования.

Предположим, что ряд Х – это затраты некой фирмы в тысячах человекочасов, а ряд Y –выпуск продукции за период n. Пусть известно значение Х для периода n+1 . Можно ли оценить (спрогнозировать) выпуск продукции для периода (n+1) ?

Допустим, что выпуск продукции зависит только от затрат труда некой фирмы и что зависимость между Х и Y линейна, т.е. имеет вид Y= a+bX. Нам также известны значения Х и Y за период n и новое значение Х для периода (n+1). В этом случае расчетное значение Y для периода (n+1) можно найти, используя функцию ТЕНДЕНЦИЯ.

 

Задание 1,

Затраты труда некой фирмы за период n представлены рядом Х а выпуск продукции за тот же период рядом Y. В ячейке В4 найти ожидаемый выпуск продукции в период n+1 если трудозатраты за тот же период составили 7,5 тысяч человекочасов

 

A B C D E F G H I J K  
известные значения X за период n 4.5 4.8 5.10 5.40 5.70 6.00 6.20 6.60 6.90 7.20  
известные значения Y за период n 7.8 7.92 8.04 8.16 8.20 8.40 8.50 8.64 8.76 8.90  
новое значения X за период n+1 7,5                    
новое значения Y за период n+1                      

 

Функция ТЕНДЕНЦИЯоставила без расшифровки значения коэффициентов a и b в уравнении Y= a+bX, а также не вывела данных для статистического оценивания полученного результата.

Для нахождения свободного члена a и коэффициента b (для многофакторного уравнения - коэффициентов b1,, b2,….., bn) используется функция ЛИНЕЙН.

Назначение функции ЛИНЕЙН –определение параметров одно – или многофакторного уравнения регрессии, включая их статистическую оценку.

 

Задание 2.

Используя для расчета исходные данные Задания 1,найти свободный член уравнения, его коэффициенты, и показатели для их статистической оценки.

Для этого необходимо:

  • выделить блок ячеек размером в 2 столбца на 5 строк (если факторов n , то блок должен быть размером (n+1) на5);
  • вызвать функцию ЛИНЕЙН и задать её аргументы, нажать ОК;
  • перейти в режим редактирования(клавиша F2);
  • завершить ввод, одновременно нажав клавиши “Ctrl” + “Shift” + “Enter”.

В выделенном блоке появятся цифры:

0,40620915 5,959739
0,010724109 0,0633
0,994455043 0,029062
1434,752409
1,211803137 0,006757

 

Появившиеся цифры означают следующее:

 

Коэффициент (b ) Const (a)
Стандартная ошибка b Стандартная ошибка a
Коэффициент детерминации r2 Стандартная ошибка уравнения
F-статистика Количество степеней свободы
Регрессионная сумма квадратов Остаточная сумма квадратов

 

Коэффициент детерминации r2 - это коэффициент корреляции в квадрате.

F-статистика – используется для определения того, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет.

Степени свободы (df) полезны для нахождения F-критических значений в статистической таблице. Для определения уровня надёжности модели нужно сравнить значения в таблице с F-статистикой, возвращаемой функцией ЛИНЕЙН.

Выше приведена таблица для однофакторного уравнения. Если уравнение регрессии многофакторное, то таблица будет расширена влево. В первой строке справа налево будут выведены свободный член и коэффициенты b1,, b2,….., bn

Уравнение регрессии будет иметь вид Y=5,9+0,4X

Стандартные ошибки параметров и стандартная ошибка уравнения невелики. Коэффициент детерминации близок к единице, Найденное значение F-статистики необходимо сравнить со значением F-критическим для восьми степеней свободы, которые можно найти в справочнике по математической статистике.

Если в целом статистическая оценка параметров уравнения регрессии окажется удовлетворительной, то найденное уравнение регрессии можно использовать для целей прогнозирования.

 

Ключевые понятия

ДИСП МЕДИАНА

Дисперсионный анализ МИН

Дисперсия РАНГ

ДИСПР Регрессионный анализ

КВАДРОТКЛ СРЗНАЧ

КОРРЕЛ СТАНДОТКЛОН

Корреляционный анализ СЧЕТ

Коэффициент корреляции СЧЕТ3

ЛИНЕЙН ТЕНДЕНЦИЯ

МАКС Уравнение регрессии

Контрольные вопросы

1. С помощью какой функции можно посчитать количество пятерок в заданном диапазоне?

2. Какие функции позволяют вычислить прогнозные значения по одному или нескольким факторам?

3. Какая функция позволяет вычислить порядок числа в заданном диапазоне?

4. Что такое дисперсия?

5. Какова разница между средним значением и медианой?

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.