Где У – фактическое значение объема продаж,
Т – трендовое значение, S – сезонная вариация, Е – ошибка (случайная составляющая). В некоторых временных рядах значение сезонной компоненты не является константой, а представляет собой определенную долю трендового значения, т.е. значения сезонной компоненты увеличиваются (или уменьшаются) с возрастанием значений тренда. Тогда строится мультипликативная модель, составляющие которой записываются в виде сомножителей. В моделях, как с аддитивной, так и с мультипликативной компонентами, общая процедура анализа и прогноза включает следующие этапы: 1. Расчет значений сезонной компоненты. 2. Исключение сезонной компоненты из фактических наблюдений (десезонализа- ция) и моделирование тренда на основе полученных данных. 3. Проверка точности модели 4. Прогнозирование. Этап 1. Для расчета значений сезонной компоненты воспользуемся методом четырехзвенной (четыре квартала в году) скользящей средней. Просуммировав первые четыре значения и разделив полученную сумму на 4, определим средний объем продаж в каждом квартале 19х6 года:
(239 + 201 + 182 + 297 ) / 4 = 229,75.
Полученное значение уже не содержит сезонной компоненты, так как представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, то есть для точки, лежащей между кварталами 2 и 3. Если последовательно продвигаться вперед (т. е. отбросить первое наблюдение, равное 239 и, добавив следующее – 324, разделить сумму на 4 и т. д.), то можно рассчитать средние квартальные значения на промежутке: апрель 19х6 – март 19х7 (251), июнь 19х6 – июль 19х7 (270,25) и т. д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет оценку искомого тренда. Рассчитанные значения тренда можно использовать для нахождения оценок сезонной компоненты: У – Т = С + Е, но прежде следует скользящие средние центрировать, чтобы они относились к тем же временным интервалам, что и исходные данные. Так, первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 19х6 года, т.е. лежит в центре промежутка фактических объемов продаж во 2 и 3 кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в 3 и 4 кварталах. Нам же требуются десезонализированные средние значения, которые можно было бы сравнить с фактическими. Найдем среднюю из первой и второй оценок, центрируя их на июль – сентябрь 19х6 г., т.е. (229,75 + 251 ) / 2 = 240,4, которую можно непосредственно сравнивать с фактическим значением за этот период, равным 182. Результаты этих расчетов приведены в таблице 1.6. Таблица 1.6 - Расчет центрированных скользящих средних значений тренда для модели У – Т = S + Е по четырем точкам
Все эти расчеты могут быть выполнены с использованием Надстройки Пакет анализа в EXCEL (см. пример 1): · В меню Сервис выберите команду Сервис – Анализ данных. · Появится диалоговое окно Анализ данных. Из списка выберите инструмент анализа Скользящее среднее и щелкните на кнопке ОК. · Появится диалоговое окно Скользящее среднее. · В поле Входной интервал наберите данные о вашей базовой линии либо укажите диапазон в рабочем листе, ссылка на него появится в этом поле. · В поле Интервал введите количество месяцев, которые хотите включить в подсчет скользящего среднего (для 4-звенной скользящей средней – четыре). · В поле ввода Выходной интервал введите адрес ячейки, с которой хотите начать вывод результата (либо просто щелкните на этой ячейке в рабочем листе). · Щелкните на кнопе ОК. EXCEL выполняет работу по вычислению скользящего среднего, значения которого начинаются с #НД из-за недостаточного количества данных для вычисления нескольких первых результатов наблюдений. Для каждого квартала мы имеем теперь оценки сезонной компоненты, которые включают в себя ошибку, или остаток (табл. 1.6). Прежде, чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Во-первых, найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Во-вторых, скорректируем средние значения, увеличивая или уменьшая их на одно и то же число таким образом, чтобы общая их сумма равнялась нулю. Это необходимо для усреднения сезонной компоненты в целом за год. Необходимые вычисления удобно выполнить в таблице (см. таблицу 1.7). Таблица 1.7 – Расчет средних значений сезонной компоненты
Значения сезонной компоненты еще раз подтверждают наши выводы, сделанные на основе анализа диаграммы: объемы продаж за два зимних квартала превышают среднее трендовое значение примерно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс. шт. соответственно. Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезонов выступают дни недели, то для исключения влияния ежедневной «сезонной компоненты» также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает. Этап 2. Десезонализация данных при расчете тренда заключается в вы- читании соответствующих значений сезонной компоненты из фактических данных за каждый квартал, т.е. У – С = Т + Е (см. табл. 1.8, столбцы 2 – 4). Новые оценки значений тренда, которые еще содержат ошибку, можно использовать для построения модели основного тренда. Если нанести эти значения на исходный график, то можно сделать вывод о наличии линейного тренда. Таблица 1.8 - Расчет десезонализированных данных и ошибок
Итак, уравнение линии тренда представим в виде:
Т = a + b t, (1.22)
где a и b характеризуют точку пересечения с осью ординат и наклон лини тренда соответственно, а t – номер квартала. Для определения параметров прямой, наилучшим образом аппроксимирующей тренд, можно использовать метод наименьших квадратов, в соответствии с которым величины оценок a и b определяются следующим образом:
, , (1.23)
где - количество наблюдений (длина временного ряда), - значение (Т + Е ) в 4-м столбце табл. 1.8. С помощью калькулятора можно подсчитать: St = 91, St2 = 819, Syt = 32746,2, Sy = 4158,6, n = 13. Подставив найденные значения в соответствующие формулы (1.23), получим: b = 19,978, a = 180,046. Следовательно, уравнение тренда (с учетом округления) имеет вид:
Т = 180 +20 t.
Построение модели тренда можно выполнить средствами EXCEL: в случае линейного тренда – посредством функции ЛИНЕЙН; нелинейного – ЛГРФПРИБЛ или, после приведения уравнения к линейному виду, функции ЛИНЕЙН; кроме того, поскольку тренд описывает изменение исследуемого показателя во времени, т.е. имеет место парная регрессия, то параметры модели можно определить с помощью мастера диаграмм. Этап 3, предшествующий составлению прогнозов, состоит в исследовании ошибок тренда, или остатков (см. столбец 6 табл. 1.8) т.е. в подтверждении адекватности трендовой модели.
Проверим случайность остаточной последовательности, используя критерий серий. В следующей таблице представлен исходный ряд остатков и вариационный ряд (по возрастанию уровней ряда остатков). Видим, что медиана ем = -1. В столбце 2 знаки «+» и «-» характеризуют разность уровней исходного ряда и медианы и образуют «серии». Количество серий равно 11, а длина максимальной составляет 2.
Сравнивая фактические значения Kmax и V с критическими, видим, что условия случайности ряда остатков в соответствии с критерием серий выполнены:
Kmax = 2 < [3,3 ( lg + 1)] = [3,3 (lg 13 + 1)] = [ 6,976] = 6, V = 11 > [ ( +1 – 1,96 )] = [ ( 13 +1 – 1,96 )] = [3,605] = 3.
Выполним проверку на нормальный закон распределения.
, , (1.5)
, .
Итак, имеем: ½А½= 0,1186 < 1,5 sA = 0,814;
½Э + ½ = 0,7815 < 1,5 sЭ = 1,1696.
Оба неравенства выполнены, т.е. можно с вероятностью 0,95 считать наличие нормального закона распределения случайных уровней ряда остатков установленным.
Проверим гипотезу о равенстве нулю математического ожидания остатков:
= < tтабл, т.е. и это свойство остаточной последовательности выполнено.
Наконец, по критерию Дарбина-Уотсона выполним проверку остатков на независимость.
,
d’ = 4 – d = 1,223.
Табличные значения d-статистики для n = 13: dH = 1,01 dВ = 1,34.
Вычисленное значение d-статистики находится между dH и dВ , поэтому гипотеза о независимости уровней ряда остатков может считаться выполненной условно (нужны дополнительные исследования).
Таким образом, по результатам проверки всех свойств ряда остатков модели можно сделать вывод о ее соответствии (адекватности) исследуемому процессу и возможности ее использования для анализа и прогнозирования.
Для определения точности модели можно использовать показатели среднего абсолютного отклонения (MAD) и среднеквадратической ошибки (MSE):
,
Как видим, ошибки достаточно малы (составляют от 1 до 2 % по отношению к исходным данным), т.е. выявленная тенденция достаточно устойчива и позволяет получить хорошие краткосрочные прогнозы. Этап 4. Прогнозные значения по модели с аддитивной компонентой рассчитываются следующим образом:
F = T + C (тыс. шт. за квартал). Порядковый номер квартала, включающего ближайшие три месяца с апреля по июль 19х9 г. равен 14, таким образом, прогнозное трендовое значение составит: Т14 = 180 + 20×14 = 460 (тыс. шт. за квартал). Соответствующая сезонная компонента равна - 20,7 тыс. шт. (2-й квартал года). Следовательно, прогноз на этот квартал: F(апрель - июнь 19х9 г.) = 4600 – 20,7 = 439,3 тыс. шт. Не следует забывать, что чем длиннее период упреждения, тем меньшей оказывается обоснованность прогноза.
В некоторых временных рядах значение сезонной компоненты не является константой, а представляет собой определенную долю трендового значения. Таким образом, значения сезонной компоненты увеличиваются с возрастанием значений тренда. Пример. Компания осуществляет реализацию нескольких видов продукции. Объем продаж одного из них за последние 13 кварталов представлены в таблице 3.15. Таблица 3.15 Квартальные объемы продаж компании
Построим по этим данным точечную диаграмму (рис. 4). Рисунок 4. - Квартальные объемы продаж компании Объем продаж этого продукта (так же, как и в предыдущем примере) подвержен сезонным колебаниям, и значения его в зимний период выше, чем в летний. Однако, размах вариации фактических значений относительно линии тренда постоянно возрастает. К таким данным следует применять модель с мультипликативной компонентой:
Фактическое значение = Трендовое значение х Сезонная вариация х Ошибка, т.е. А = Т*С*Е. (3.23)
В нашем примере есть все основания предположить существование линейного тренда, но чтобы полностью убедиться в этом, проведем процедуру сглаживания временного ряда. Эта процедура ничем не отличается от той, которая применялась для аддитивной модели, кроме того, что теперь оценки сезонной компоненты следует определять по формуле
А / Т = С * Е. (3.24)
Результаты расчетов приведены в табл. 3.16, причем для вычисления скользящих средних использован Пакет анализа в EXCEL (см. пример 2). Таблица 3.16 Расчет значений сезонной компоненты
Продолжение таблицы 3.16
Так как значения сезонной компоненты в данном случае – это доли, а число сезонов равно 4, то сумма компонент должна равняться 4 (количеству сезонов), а не нулю, как в предыдущем случае. Если эта сумма не равна 4, то производится корректировка значений сезонной компоненты точно таким же образом, как это уже делалось ранее. Корректировка выполнена в таблице 3.17.
Таблица 3.17 Расчет сезонной компоненты
Как показывают оценки, в результате сезонных воздействий объемы продаж в январе – марте увеличиваются на 11,6% соответствующего значения тренда (1,116). Аналогичные сезонные воздействия в октябре – декабре приводят к увеличению объема продаж на 5,5% от соответствующего значения тренда. В двух других кварталах сезонные воздействия состоят в снижении объемов продаж, которое составляет 90,7 и 92,2% от соответствующих трендовых значений. После определения оценок сезонной компоненты приступим к процедуре десезонализации данных по формуле:
А / С = Т * Е. (3.25)
Результаты расчетов этих оценок приведены в таблице 3.18. Таблица 3.18 Расчет уравнения тренда для компании
Полученные трендовые значения нанесем на исходную диаграмму (рис. 4). Очевидно, что линия тренда – не кривая, наоборот, она несколько больше напоминает прямую, хотя отдельные точки, особенно значения за 19х6 г., расположены хаотично. Предположим для простоты, что тренд линейный, и для расчета параметров прямой, наилучшим образом его аппроксимирующей, применим метод наименьших квадратов. Воспользуемся той же процедурой, что и в примере 2: Таблица 3.19 Рабочий лист EXCEL
Таким образом, уравнение тренда выглядит следующим образом:
Т = 63,35 + 1,63 * номер квартала (тыс. шт. в квартале).
Это уравнение можно использовать в дальнейшем для расчета оценок трендовых объемов продаж на каждый момент времени (см. табл. 3.20). Кроме того, трендовые значения можно определить с помощью функции ТЕНДЕНЦИЯ в EXCEL, как это сделано в табл. 3.19, гр. 5 [4]. После нахождения тренда и сезонной компоненты можно рассчитать ошибки в прогнозируемых по модели объемах продаж (Т*С) по сравнению с фактическими значениями (А). В табл. 3.20 эти ошибки рассчитаны как отношение Е = А / (Т*С). Таблица 3.20 Расчет трендовых значений и ошибок Е1 и Е2
Вычисленные по е1 и е2 средняя абсолютная и среднеквадратическая ошибки имеют следующие значения соответственно:
1. MAD = 12,9 / 13 = 0,99; MSE = 12,82 / 13 = 0,986;
2. MAD = 27,5 / 13 = 2,12; MSE = 84,915 / 13 = 6,53.
После того, как параметры уравнения тренда определены, процедура составления прогнозов становится очевидной. Прогнозные значения определяются по формуле: F = Т * C, (3.26) где Т = 63,35 + 1,63 * номер квартала (тыс. шт. за квартал), а сезонные компоненты составляют 1,116 в первом квартале, 1,097 – во втором, 0,922 – в третьем и 1,055 в четвертом квартале. Ближайший следующий квартал – это второй квартал 19х9 г., охватывающий период с апреля по июнь и имеющий во временном ряду порядковый номер 14. Прогноз объема продаж в этом квартале составляет:
F = Т*C = (63,35 + 1,63 *14)*0,907 = 86,17 * 0,907 = 78,2 (тыс. шт. за квартал).
Аналогично, прогноз на октябрь – декабрь 19х9 г. рассчитывается для квартала с порядковым номером 16 с использованием значения сезонной компоненты для 4-го квартала года:
F = Т*C = (63,35 + 1,63 *16)*1,055 = 89,43 * 1,055 = 94,3 (тыс. шт. за квартал).
Разумно предположить, что величина ошибки данного прогноза будет несколько выше, чем предыдущего, поскольку этот прогноз рассчитан на более длительную перспективу.
2. ЗАДАНИЯ ДЛЯ ИНДИВИДУАЛЬНОЙ (КОНТРОЛЬНОЙ) РАБОТЫ
Контрольная работа по прогнозированию содержит 3 задания. Варианты исходных данных выбираются по первой букве фамилии студента и последней цифре его зачетной книжки. Каждое задание целесообразно выполнять после изучения соответствующего теоретического материала по лекциям и учебнику. Разобравшись в сущности изучаемой проблемы, студент должен подготовить необходимую информацию для проведения расчетов, которые предполагается выполнить на практических и консультационных семестровых занятиях на персональных компьютерах в лабораториях института. После выполнения расчетов, необходимо сделать выводы и, оформив контрольную работу в соответствии с общими требованиями, сдать ее на проверку, подписав и указав использованные в ходе выполнения работы литературные источники.
Выбор варианта осуществляется по следующей таблице:
1. В таблице 2.4 представлены исходные данные для выполнения первого задания. 2. Исследуйте сезонность потребленной электроэнергии, предварительно исключив основную тенденцию развития методом 4-звенной скользящей средней. 3. Выполните прогноз потребления электроэнергии на следующий год. Таблица 2.4 Потребление электроэнергии (тыс. кВт.ч) (поквартально)
|