4) ? (20)=8- число серий;
т max(20)=4- протяженность самой большой серии.
В соответствии с (1.7.) делаем проверку:
47
86
Tm.x(20) [3,3(lg20 +1)]
и(20)
2 (20 +1 - (96V20 -1)
Оба неравенства выполняются. С вероятностью 0,95 тренд во временном ряду отсутствует, что согласуется с выводом, сделанным с помощью метода Фостера-Стюарта.
Использование скользящих средних для сглаживания временных рядов
Для количественной оценки динамики явлений применяются статистические показатели: абсолютные приросты, темпы роста, темпы прироста, причем они могут разделяться на цепные, базисные и средние.
В основе расчета этих показателей динамики лежит сравнение уровней временного ряда. Если сравнение осуществляется с одним и тем же уровнем, принятым за базу сравнения, то эти показатели называются базисными.
Если сравнение осуществляется при переменной базе, и каждый последующий уровень сравнивается с предыдущим, то вычисленные таким образом показатели называются цепными.
Абсолютный прирост Ау равен разности двух сравниваемых уровней.
Темп роста Т характеризует отношение двух сравниваемых уровней ряда, выраженное в процентах.
Темп прироста К характеризует абсолютный прирост в относительных величинах. Определенный в % темп прироста показывает, на сколько процентов изменился сравниваемый уровень по отношению к уровню, принятому за базу сравнения.
В таблице 2.1. приведены выражения для вычисления базисных и цепных приростов, темпов роста, темпов прироста. При этом использованы следующие обозначения:
Уі,У2, ... ,yt, ... ,Уп- уровни временного ряда t=1, 2, ... , n;
п- длина временного ряда;
Уб -уровень временного ряда, принятый за базу сравнения.
Таблица 2.1. Основные показатели динамики |
||||||||||||||||
|
Распространенным приемом при выявлении тенденции развития является сглаживание временного ряда. Суть различных приемов сглаживания сводится к замене фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени. Это способствует более четкому проявлению тенденции развития.
Иногда сглаживание применяют как предварительный этап перед использованием других методов выделения тенденции (например, рассматриваемых в третьей главе).
Скользящие средние позволяют сгладить как случайные, так и периодические колебания, выявить имеющуюся тенденцию в развитии процесса, и поэтому, являются важным инструментом при фильтрации компонент временного ряда.
Алгоритм сглаживания по простой скользящей средней может быть представлен в виде следующей последовательности шагов:
1. Определяют длину интервала сглаживания g, включающего в себя g последовательных уровней ряда (gn). При этом надо иметь в виду, что чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный, сглаженный характер.
Чем сильнее колебания, тем шире должен быть интервал сглаживания.
2. Разбивают весь период наблюдений на участки, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1.
3. Рассчитывают арифметические средние из уровней ряда, образующих каждый участок.
4. Заменяют фактические значения ряда, стоящие в центре каждого участка, на соответствующие средние значения.
При этом удобно брать длину интервала сглаживания g в виде нечетного числа: g=2p+1, т.к. в этом случае полученные значения скользящей средней приходятся на средний член интервала.
Наблюдения, которые берутся для расчета среднего значения, называются активным участком сглаживания.
При нечетном значении g все уровни активного участка могут быть представлены в виде:
yt^ yt-p+b ... , yt-b Уь yt+ц ... , yt+p-b Уt+p,
а скользящая средняя определена по формуле:
t+p
I y.
i=t-p
yt-p + yt-p+i + - - - + yt+p-i + yt+p
(2.3.),
У ‘ 2p +1 2p +1
где y.- фактическое значение i-го уровня;
y t - значение скользящей средней в момент t; 2p+1- длина интервала сглаживания.
Процедура сглаживания приводит к полному устранению периодических колебаний во временном ряду, если длина интервала сглаживания берется равной или кратной циклу, периоду колебаний.
Для устранения сезонных колебаний желательно было бы использовать четырех- и двенадцатичленную скользящие средние, но при этом не будет выполняться условие нечетности длины интервала сглаживания. Поэтому при четном числе уровней принято первое и последнее наблюдение на активном участке брать с половинными весами:
t+p-1
2 y t-p + Z y i + 2y
yt-p + yt-p+1 + - - - + yt-1 + yt + yt+1 + - - - + yt+p-1
+ 2yt+p
t+p
(2- 4- )
i=t-p+1
2p
2p
Тогда для сглаживания сезонных колебаний при работе с временными рядами квартальной или месячной динамики можно использовать следующие скользящие средние:
1 1
(2- 5- )
(2- 6- )
^Yt-2 + у t-1 + Yt + Yt+1 + ^Yt+2
11
2yt-6 + Y t-5 + - - - + yt + - - - + yt+5 + 2yt+6
12
При использовании скользящей средней с длиной активного участка g=2p+1 первые и последние p уровней ряда сгладить нельзя, их значения теряются^ Очевидно, что потеря значений последних точек является существенным недостатком, ък для исследователя последние свежие данные обладают наибольшей информационной ценностью^ Рассмотрим один из приемов, позволяющих восстановить потерянные значения временного ряда^ Для этого необходимо:
1) Вычислить средний прирост на последнем активном участке
yt-p+1, - - - , уЬ - - - , yt+p-1, yt+p
т Yt+p - Yt-p
g - 1
где g- длина активного участка;
yt+p- значение последнего уровня на активном участке;
yt _ p- значение первого уровня на активном участке;
Ay-средний абсолютный приросъ
2) Получить P сглаженных значений в конце временного ряда путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению -
Аналогичную процедуру можно реализовать для оценивания первых уровней временного ряда^
Метод простой скользящей средней применим, если графическое изображение динамического ряда напоминает прямую - Когда тренд выравниваемого ряда имеет изгибы, и для исследователя желательно сохранить мелкие волны, применение простой скользящей средней нецелесообразно.
Если для процесса характерно нелинейное развитие, то простая скользящая средняя может привести к существенным искажениям. В этих случаях более надежным является использование взвешенной скользящей средней.
При сглаживании по взвешенной скользящей средней на каждом участке выравнивание осуществляется по полиномам невысоких порядков. Чаще всего используются полиномы 2-го и 3-его порядка.
Так как при простой скользящей средней выравнивание на каждом активном участке производится по прямой (полиному первого порядка), то метод простой скользящей средней может рассматриваться как частный случай метода взвешенной скользящей средней. Простая скользящая средняя учитывает все уровни ряда, входящие в активный участок сглаживания, с равными весами, а взвешенная средняя приписывает каждому уровню вес, зависящий от удаления данного уровня до уровня, стоящего в середине активного участка.
Выравнивание с помощью взвешенной скользящей средней осуществляется следующим образом.
Для каждого активного участка подбирается полином вида
y t = о + + a21 +... ,
параметры которого оцениваются по методу наименьших квадратов. При этом начало отсчета переносится в середину активного участка. Например, для длины интервала сглаживания g=5, индексы уровней активного участка будут следующими i: -2, -1, 0, 1, 2.
Тогда сглаженным значением для уровня, стоящего в середине активного участка, будет значение параметра а0 подобранного полинома.
Нет необходимости каждый раз заново вычислять весовые коэффициенты при уровнях ряда, входящих в активный участок сглаживания, т.к. они будут одинаковыми для каждого активного участка. Причем при сглаживании по полиному к-ой нечетной степени весовые коэффициенты будут такими же, как при сглаживании по полиному (к-1) степени.
В таблице 2.2. представлены весовые коэффициенты при сглаживании по полиному 2-го или 3-го порядка ( в зависимости от длины интервала сглаживания).
Так как веса симметричны относительно центрального уровня, то в таблице использована символическая запись: приведены веса для половины уровней активного участка; выделен вес, относящийся к уровню, стоящему в центре участка сглаживания. Для оставшихся уровней веса не приводятся, т. к. они могут быть симметрично отражены.
Например, проиллюстрируем использование таблицы для сглаживания по параболе 2-го порядка по 5-членной взвешенной скользящей средней. Тогда центральное значение на каждом активном участке yt-2, yt-1, yt, yt+1, yt+2, будет оцениваться по формуле:
Отметим важные свойства приведенных весов:
1) Они симметричны относительно центрального уровня.
2) Сумма весов с учетом общего множителя, вынесенного за скобки, равна единице.
3) Наличие как положительных, так и отрицательных весов, позволяет сглаженной кривой сохранять различные изгибы кривой тренда.
Существуют приемы, позволяющие с помощью дополнительных вычислений получить сглаженные значения для Р начальных и конечных уровней ряда при длине интервала сглаживания g=2p+1.
Удобным средством описания одномерных временных рядов является их выравнивание с помощью тех или иных функций времени (кривых роста). Кривая роста позволяет получить выравненные или теоретические значения уровней динамического ряда.
Это те уровни, которые наблюдались бы в случае полного совпадения динамики явления с кривой.
Процедура разработки прогноза с использованием кривых роста включает в себя следующие этапы:
1) выбор одной или нескольких кривых, форма которых соответствует характеру изменения временного ряда;
2) оценка параметров выбранных кривых;
3) проверка адекватности выбранных кривых прогнозируемому процессу и окончательный выбор кривой роста;
4) расчет точечного и интервального прогнозов.
В настоящее время в литературе описано несколько десятков кривых роста, многие из которых широко применяются для выравнивания экономических временных рядов.
Кривые роста условно могут быть разделены на три класса в зависимости от того, какой тип динамики развития они хорошо описывают.
К I типу относятся функции, используемые для описания процессов с монотонным характером развития и отсутствием пределов роста. Эти условия справедливы для многих экономических показателей, например, для большинства натуральных показателей промышленного производства.
Ко II классу относятся кривые, описывающие процесс, который имеет предел роста в исследуемом периоде. С такими процессами часто сталкиваются в демографии, при изучении потребностей в товарах и услугах (в расчете на душу населения), при исследовании эффективности использования ресурсов и т.д.
Примерами показателей, для которых могут быть указаны пределы роста, являются среднедушевое потребление определенных продуктов питания, расход удобрений на единицу площади и т.п.
Функции, относящиеся ко II классу, называются кривыми насыщения. Если кривые насыщения имеют точки перегиба, то они относятся к III типу кривых роста - к S-образным кривым.
Эти кривые описывают как бы два последовательных лавинообразных процесса (когда прирост зависит от уже достигнутого уровня): один с ускорением развития, другой - с замедлением.
S-образные кривые находят применение в демографических исследованиях, в страховых расчетах, при решении задач прогнозирования научно-технического прогресса, при определении спроса на новый вид продукции.
Вопрос о выборе кривой является основным при выравнивании
ряда.
Существует несколько подходов к решению этой задачи, однако, все они предполагают знакомство с основными свойствами используемых кривых роста. Поэтому остановимся на характеристике отдельных типов кривых, наиболее часто применяемых на практике.
Среди кривых роста I типа, прежде всего следует выделить класс полиномов:
yt= ao + ait + a2t2 + ... + aptp, (3.1.)
где ai(i=0,1, ... ,p)- параметры многочлена,
t- независимая переменная (время).
Коэффициенты полиномов невысоких степеней могут иметь конкретную интерпретацию в зависимости от содержания динамического ряда. Например, их можно трактовать как скорость роста (a1), ускорение роста^), изменение ускорения (a3), начальный уровень ряда при t=0 (a0).
Обычно в экономических исследованиях применяются полиномы не выше третьего порядка. Использовать для определения тренда полиномы высоких степеней нецелесообразно, поскольку полученные таким образом аппроксимирующие функции будут отражать случайные отклонения (что противоречит смыслу тенденции).
Полином первой степени yt=a0+a1t на графике изображается прямой и используется для описания процессов, развивающихся во времени равномерно.
Полином второй степени yt=a0+a1t+a2t2 применим в тех случаях, когда процесс развивается равноускоренно (т.е. имеется равноускоренный рост или равноускоренное снижение уровней).
Как известно, если параметр a20 , то ветви параболы направлены вверх, если же a20, то вниз. Параметры a0 и a1 не влияют на форму параболы, а лишь определяют ее положение.
Полином третьей степени имеет вид yt=a0+a1t+a2t2+a3t3 .
У этого полинома знак прироста ординат может изменяться один или два раза (рисунок 3.1.).
Отличительная черта полиномов - отсутствие в явном виде зависимости приростов от значений ординат (yt).
Оценки параметров в модели (3.1.) определяются методом наименьших квадратов. Как известно, суть его состоит в отыскании таких параметров, при которых сумма квадратов отклонений расчетных значений уровней от фактических значений была бы минимальной. Таким образом, эти оценки находятся в результате минимизации выражения:
2(yt- yt)2 ^min, (3.2)
t=i
где yt - фактическое значение временного ряда;
y t - расчетное значение;
n - длина временного ряда.
Не будем останавливаться на математическом аппарате метода наименьших квадратов, подробно описанного в литературе по математической статистике.
Приведем систему нормальных уравнений, полученную в результате минимизации выражения( 3.2.):
2 yt = a0 ' n + a12t + a2 2t2 +- - - +aP 2tP
2 yt ¦t = ao 2t+ai 2t2 + a2 2t3 +- - - + ap 2tP+1
- - - - - - - - - (3.3.)
2 yt ¦tP 1 = ao 2tP 1 + ai 2tP + a2 2tP+1 +- - - +ap 2t2p 1
2 yt ¦tP = ao 2tP + a12tP+1 + a2 2tP+2+- - - +aP 2t2P
Система (3.3.) состоит из (P+1) уравнений, содержащих в качестве неизвестных величин (P+1) коэффициентов a0, a1, - - - , aF - Решение этой системы позволяет вычислить оценки искомых коэффициентов -
Системы для оценивания полиномов невысоких степеней выглядят намного проще- Например, нормальные уравнения для оценивания параметров прямой:
2 yt = a0 ¦n + a12t (34)
2 yt ¦t = ao 2t+a12t
Решение этой системы относительно искомых параметров дает следующие выражения:
2 yt ¦ t-2+-21
a1 =
; ao
(21 )2
22 -
Для параболы 2-го порядка получим аналогичную систему нормальных уравнений:
2 yt = ao ¦n+a12t+a2 2t2
2 yt ¦t = ao 2t+a12t2+a2 2t3 (3.50
2 yt ¦t2 = ao 2t2 + a12t3 + a2 2t4
Эта система содержит три уравнения, позволяющих найти оценки трех неизвестных коэффициентов ao, a1, a2.
Составление нормальных уравнений можно упростить, воспользовавшись тем, что величины 21, 2t2, - - - не зависят от конкретных уровней динамического ряда. Эти суммы являются функциями только числа членов в динамическом ряду. Для них получены следующие формулы:
= n(n +1); ^t2 = n(n +1)(2n +1);
3 _ n2(n +1)2 ^^4 _ n(n + 1)(2n + 1)(3n2 + 3n -1)
1t3=Z t4=30
(Суммирование по t= 1^n).
Другой подход к упрощению расчетов заключается в переносе начала координат в середину ряда динамики. Это позволяет упростить сами нормальные уравнения, а также уменьшить абсолютные значения величин, участвующих в расчете. Если до переноса начала координат t было равно1,2,3,..., то после переноса
для четного числа членов ряда t=...,-5;-3;-1;1;3;5;...; для нечетного числа членов ряда t=...,-3;-2;-1;0;1;2;3;... .
Таким образом, Ztk, где k - нечетное число, равна 0. Такой
подход существенно упрощает систему (3.3.).
В этом случае оценки параметров соответствующих полиномов имеют вид:
Zy..
5
(3.6.)
Прямой
а0 =
(3.7.)
параболы
Zyt - .. nZyt - t2 -Zt2 - Zyt
nZt4 -Z )2
Для класса экспоненциальных кривых, в отличие от полиномов, характерной является зависимость приростов от величины самой функции. Эти кривые хорошо описывают процессы, имеющие лавинообразный характер, когда прирост зависит от достигнутого уровня функции.
Простая экспоненциальная (показательная) кривая имеет вид:
yt = a - b1 (3.8.)
Если в1, то кривая растет вместе с ростом t, и падает, если b1.
Параметр а характеризует начальные условия развития, а параметр b-постоянный темп роста.
У.
У. -1
Действительно, темп роста равен Tt = а - b1
В данном случае Tt = _ .-1 - 100% = b - 100% = const.
- 100%. аЬ
Соответственно и темпы прироста- постоянны Kt=Tt-100%=const
Можно показать, что логарифм ординаты этой функции линейно зависит от t, для этого прологарифмируем выражение (3.8.):
log yt= log a+t log b.
Пусть log a=A; log b=B. Тогда log yt =A+tB.
Теперь для оценивания неизвестных параметров можем использовать систему нормальных уравнений для прямой (3.4.).
Иначе говоря, нормальные уравнения строятся исходя из минимизации:
? (log yt - log y t)2 ^ min
Соответственно в нормальных уравнениях вместо фактических уровней выступают их логарифмы:
(3.9.)
? lg yt = n - A + B?t
?(og yt - t )=A?t+B?t2
Найдем неизвестные параметры A и B. Зная значения A =log a и B =log b, определим значения a и b, и с помощью потенциирования получим показательную функцию, служащую для выравнивания ряда.
Такой подход к оцениванию неизвестных параметров привлекает своей универсальностью. Однако, следует иметь в виду, что полученные оценки параметров оказываются смещенными, т. к. при расчете участвуют не исходные уровни, а их логарифмы. Смещение будет тем значительнее, чем больше разность между последовательными уровнями динамического ряда.
Не приводит к смещению в подобных случаях нелинейный метод наименьших квадратов.
Более сложным вариантом экспоненциальной кривой является логарифмическая парабола
yt=axbt х/ (3.10.)
Прологарифмировав выражение (3.10.), получим параболу log yt = log a+t log b+t2log c
Таким образом, оценку параметров логарифмической параболы можно опять осуществить с помощью метода наименьших квадратов, используя систему нормальных уравнений для параболы (3.5.). При этом остаются в силе сделанные выше замечания о смещении полученных оценок.
Все рассмотренные типы кривых используются для описания монотонно возрастающих или убывающих процессов без насыщения.
Когда процесс характеризуется насыщением, его следует описывать при помощи кривой, имеющей отличную от нуля асимптоту. Примером такой кривой может служить модифицированная экспонента: yt=k+axbt (3.11.),
где y = k является горизонтальной асимптотой.
Если параметр a отрицателен, то асимптота находится выше кривой, если a положителен, то ниже. При решении экономических задач чаще всего приходится иметь дело с кривой, у которой a0 , b1.
В этом случае рост уровней происходит с замедлением и стремится к некоторому пределу.
При решении экономических задач часто можно определить значение асимптоты исходя из свойств прогнозируемого процесса (например, коэффициент использования оборудования не может превышать 1). Иногда значение асимптоты задается экспертным путем. В этих случаях другие параметры кривой могут быть определены с помощью метода наименьших квадратов после приведения уравнения к линейному виду:
yt - k/=axbt (3.12.),
где k1- заданное значение асимптоты.
Прологарифмируем (3.12):
log (yt - k/) = log a + t log b
Теперь оценить параметры log a и log b можно, использовав систему нормальных уравнений (3.9.).
Для оценивания параметров модифицированной экспоненты возможно применение как нелинейного метода наименьших квадратов, так и ряда других методов, в которых вычисления проще, но оценки менее эффективные.
Таким образом, модифицированная экспонента хорошо описывает процесс, на развитие которого воздействует ограничивающий фактор, причем влияние этого воздействия растет вместе с ростом достигнутого уровня.
Если воздействие ограничивающего фактора начинает сказываться только после определенного момента (точки перегиба), до которого процесс развивался по некоторому экспоненциальному закону, то для выравнивания используют S-образные кривые.
Наиболее известными из них являются кривая Гомперца и логистическая кривая, или кривая Перла-Рида.
Кривая Гомперца имеет вид: yt = kxab .
Кривая несимметрична.
Если log a 0, кривая имеет S-образный вид, при этом асимптота, равная k, проходит выше кривой.
Если log a 0, асимптота, равная k , лежит ниже кривой , а сама кривая изменяется монотонно: при b1 - монотонно убывает; при b1 -монотонно возрастает.
Для решения экономических задач наибольший интерес представляет вариант этой кривой, когда log a 0 и b1 (рисунок 3.1.).
Уравнение логистической кривой получается путем замены в