Метод инвариантов для прогнозирования

Опубликовано: 
Компьютерная математика. 2008, № 1

Введение. Финансовой сектор экономики Украины переживает инвестиционный подъем, связанный с потребностью инвесторов (в частности западных) в повышении доходности финансовых ресурсов. Поэтому отечественные банки должны работать на рынке максимально быстро и эффективно оперировать средствами для получения прибыли.

Для выбора оптимального пути развития финансовым аналитикам приходиться анализировать множество альтернатив и исследовать текущие тенденции в развитии финансовой организации. Низкий уровень математических знаний экономических специалистов, нехватка кадров, порождают потребность в упрощении классических методов прогнозирования и разработке методик, с высокой вероятностью гарантирующих качественные результаты прогнозирования. В представленной далее методике скомбинированы два классических метода: прогнозирование и поиск инвариантов. Такая комбинация позволяет, с одной стороны, максимально использовать достижения в прогнозировании, а с другой, – гарантировать качество прогнозов «в лоб» при наличии инварианта.

Постановка задачи.Обычно прогнозирование выдвигает следующие требования к данным для получения точного и достоверного прогноза.

1.      Данные должны быть достоверными и точными, т.е. получены из достоверного источника и с требуемой точностью.

2.      Данные должны быть значимыми, т.е. отражать обстоятельства, для анализа которых их используют.

3.      Данные должны быть согласованными. Если изменились обстоятельства, в отношении которых данные собирались, необходимо внести корректировки, направлен­ные на сохранение согласованности новых данных с хронологически сложившейся структурой.

4.      Данные необходимо собирать через определенные интервалы времени, поскольку соб­ранные и подытоженные в строгом хронологическом порядке данные наи­более интересны в целяхй прогнозирования. Кроме того, данных может быть либо слишком мало (недостаточно предыстории, на которой базировались бы бу­дущие исходы), либо слишком много (данные периодов отдаленного прошлого, не имеющие отношения к поставленной задаче). [2]

Под словом «качество» подразумевают соответствие данных вышеизложенным требованиям. Поэтому уровень эконометрических знаний человека, на которого возложена задача прогнозирования, должен быть достаточно высокий. Данное требования, выдвигается в связи с необходимостью  выбора оптимального по точности метода прогнозирования.

Отметим, что в отечественной литературе не выработано единого подхода к определению финансовой стойкости банка [1]. Задача формулируется так: разработать эффективную методику оценки финансовой стойкости организации.

Принятые соглашения. Параметрами оценки работы финансовой структуры принят уровень балансовых счетов и файл #01 постановления правления национального банка Украины от 28 августа 2001 года N368 статистической отчетности НБУ. Данные этого уровня позволяют детально оценить состояние финансовой структуры без нарушения коммерческой тайны.

Для оценки состояния финансовой структуры использован метод сравнений, т.е. сравнение фактических данных периода и прогнозных значений за тот же период. На основе сравнительного анализа сделан вывод о состоянии структуры.

Обзор решений. Для решения задачи можно использовать:

1.      Классические методы прогнозирования

2.      Эконометрические модели.

3.      Метод инвариантов.

Классические методы прогнозирования требуют данных высокого «качества» и соответственно высокой квалификации аналитика в области прогнозирования. Относительно точности прогноза можно сказать следующее: «Эмпирические исследования показали, что точность прогноза, выполненного простыми методами, практически также хороша, как точность, полученная при использовании комплексной или статистически сложной методики» [2].

Эконометрические модели (модели банковской фирмы) – мощный и удобный инструмент для оценки состояния финансовой структуры, также позволяя тонкую настройку модели. Согласно Балтенспергеру [4], полная модель должна объяснить решение: (1) об активах и обязательствах банка (и их взаимодействии); (2) о размерах банковского капитала. В теории банковской фирмы Сили построил квазиполную модель банка, интегрировав два частных направления моделирования, однако вопросы банковского капитала остались за пределами модели [3].

К недостаткам можно отнести отсутствие полных и детальных моделей банковских фирм для экономики Украины, это обусловлено высокой стоимостью и сложностью таких моделей. Потребность в полных и детальных моделях вытекает из сути комплексной оценки финансовой структуры как «состояния финансов субъекта финансово-хозяйственной деятельности, что характеризуется некоторым набором показателей» [1].

Метод инвариантов использует классический аппарат прогнозирования, но заменяя сложный анализ данных на принадлежность к «качественным» более простым, хотя и более эвристичным подходом к выбору инварианта. Таковым является поиск инварианта среди макропоказателей государства. Положительная сторона – это упрощения прогнозирования, а также возможность анализа и сравнение тенденций на микро- и макроуровнях.

К недостаткам относят возможность ошибки аналитика при поиске инварианта, т.е. человек должен быть достаточно квалифицирован для идентификации экономической схожести генеральной выборки и кандидата в инварианты.

Идентификация «качества» данных.  Для проверки качества данных выбран метод поиска инвариантов. Тогда инвариантом выступает временной ряд, который с некоторою точностью повторят тенденции генеральной выборки.

Основная гипотеза, выдвинутая при решении задачи о том, что данные экономических временных рядов на микроуровне (фирма) имеют инварианты на макроуровне (государство). При подтверждении гипотезы имеем простой и мощный инструмент проверки данных на соответствие критериям качества данных. Это выражается в том, что макропоказатели на более высоким уровне отображают тенденции в экономике. Поскольку эти показатели агрегируют множество данных, то сглаживаются аномалии, присущие некоторым участникам рынка. Значит, если есть инвариант на макроуровне для генеральной совокупности, то можно считать, что данные «качественные».

Для поиска инвариантов коэффициент, отвечающий за схожесть между генеральной выборкой и кандидатом в инварианты, был коэффициентом корреляции. Выборка построена как инвариант, если она имела наибольший коэффициент корреляции из всех возможных.

Также для подтверждения гипотезы проведен автокорреляционный анализ, причем анализировалось наличие тренда и коэффициента автокорреляции. Полученные данные для генеральной совокупности и инварианта сравнивались для окончательного вывода о выборе ряда как инварианта.

Сужение набора методов прогнозирования. С этой целью использован классический автокорреляционный анализ как достаточно простой и мощный инструмент исследования временных рядов. Заметим, что инструменты автокорреляционного анализа включены в подборку пакетов статистической обработки данных.

Аппарат прогнозирования для данных, имеющих тренд, используется в случаях.

1.    Повышение производительности труда и применение новых технологий ведут к изменению стиля жизни.

2.    Рост населения увеличивает потребность в товарах и услугах.

3.    Покупательная способность гривны за счет инфляции оказывает влияние на общеэкономические показатели.

4.    Возрастает признание продукта на рынке.

Аппарат, используемый для прогнозирования ря­дов, имеющих тренд, – это метод скользящих средних, метод линейного экспоненци­ального сглаживания Хольта (HoIt), простая регрессия, возрастающие кривые, экспо­ненциальные модели и методы авторегрессионых интегрированных скользящих средних (методы Бокса-Дженкинса). Стационарные методы прогнозирования целесообразны для случаев, когда:

1.    воздействия, порождающие ряд, стабилизировались, и окружающая среда, в которой ряд существует, относительно неизменна;

2.    в силу недостатка данных либо для упрощения объяснения или реализации прогноза не­обходимо использовать простейшую модель.

3.    стабильности можно достичь за счет простой корректировки таких фак­торов, как рост населения или инфляции;

4.    ряд можно преобразовать в стабильный;

5.    ряд – это множество ошибок прогноза, полученных в результате при­менения метода прогнозирования, который можно считать неадекватным.

Методы прогнозирования, применимые по отношению к стационар­ным рядам, включают наивные методы, методы простого усреднения, скользящие средние, простое экспоненциальное сглаживание и методы авторегрессионного скользя­щего среднего (методы Бокса-Дженкинса).

Аппарат прогнозирования для данных с сезонной компонентой используют в следующих случаях, когда:

1.    на изучаемую величину влияет погодно-климатические условия, например, потребление электро­энергии, уровень летней и зимней активности;

2.    рассматриваемая величина определяется годичным циклом.

Методы, используемые для прогнозирования сезонных рядов, включают классическое разложение, Census X-12, экспоненциальное сглаживание Винера (Winter), многомерную регрессию временного ряда и Бокса-Дженкинса.

Аппарат прогнозирования для циклических рядов применим, когда:

1.      на интересующую нас величину влияет бизнес-цикл;

2.      имеют место изменения в социально-общественных предпочтениях;

3.      возникают изменения в народонаселении;

4.      происходят сдвиги в цикле производства продуктов потребления.

Аппарат, который необходимо использовать для прогнозирования циклических рядов, включает классическое разложение, экономические индикаторы, эконометрические модели, многомерную регрессию и методы Бокса-Дженкинса. Результирующая таблица представлена в табл. 1.

ТАБЛИЦА 1. Выбор метода прогнозирования

Метод

Модель данных

Временная отдаленность

Тип модели

Несезонные

Сезонные

Наивный

CT, T, С

К

BP

1

 

Простые средние

CT

К

BP

30

 

Скользящие средние

CT

К

BP

4-20

 

Экспоненциальное сглаживание

CT

К

BP

2

 

Линейное экспоненциаль­ное сглаживание

T

К

BP

3

 

Квадратичное экспоненци­альное сглаживание

T

К

BP

4

 

Сезонное экспоненциальное сглаживание

С

К

BP

 

2хС

Адаптивная фильтрация

С

К

BP

 

5хС

Простая регрессия

T

С

К

10

 

Множественная регрессия

Ц, С

С

К

10xB

 

Классическое разложение

С

К

BP

 

5хС

Экспоненциальные трендовые модели

T

С, Д

BP

10

 

Подгонка S-кривой

T

С, Д

BP

10

 

Модели Гомперца

T

С, Д

BP

10

 

Возрастающие кривые

T

С, Д

BP

10

 

"Перепись-Н"

С

К

BP

 

6хС

Модели Бокса-Дженкинса

CT, T, Ц, С

К

BP

24

ЗхС

В таблице модели данных: CT – стационарные; T – трендовые; С – сезонные; Ц – циклические. Дальность прогноза во времени: К – краткий период (менее трех месяцев); С – средний; L – большой. Тип модели: BP – временной ряд; К – каузальная. Сезонные: С – продолжительность сезонности. Величина: В – количество величин. [2]

Обратим внимание на интересный результат, который получен в работе [5] и свидетельствует, что более сложные методы прогнозирования дают ненамного лучшие результаты по сравнению с более простыми.

Реализация методологи на примере крупного банка. Для проверки практичности методологии проведен эксперимент на примере крупного Украинского банка.        Как генеральные совокупности выбраны «средства на текущих счетах в долларах США» и «средства на текущих и депозитных счетах в гривне», а инвариантами служили такие макропоказатели НБУ, как «курс доллара США»  и «Параметр М0» соответственно. Генеральная выборка состояла из усредненных данных поквартально с 2001 года по 2006.  «Средства на текущих и депозитных счетах в гривне» и «Параметр М0» скорректированы на инфляцию за период анализая.

Корреляция составила (см. рис. 1 и 2):

1.    «Средства на текущих счетах в долларах США» и «курс доллара США» –  -0,774

2.    «Средства на текущих и депозитных счетах в гривне» и «Параметр М0» –  0,947

     

РИС. 1 - Анализ тренда для «Средства на текущих счетах в долларах США» и «курс доллара США»

РИС. 2 - Анализ тренда для «Средства на текущих и депозитных счетах в гривне» и «Параметр М0»

Исходя из тренда видно, что при отрицательной корреляции имеем зеркально отображенный тренд на графике «курс доллара США». Также тренды генеральных совокупностей и инвариантов повторяют тенденции один другого, что позволяет сделать вывод о правильности выбора инвариантов.

Результаты автокорреляционного анализа, приведенные на рис. 3 и 4, показывает соответствие генеральных  выборок и инвариантов.

Наличие инвариантов позволяет прогнозировать состояние макропоказателей (или использовать уже готовые прогнозы). Поскольку макропоказатели агрегируют большие объемы данных, таким образом сглаживая аномалии, прогнозы построенные на их базе являются более точными. В табл. 2. приведены результаты прогнозирования для 4-х выше указанных выборок.

 

РИС. 3 - Автокорреляционный анализ для «Средства на текущих счетах в долларах США» и «курс доллара США»

      

РИС. 4 - Автокорреляционный анализ для «Средства на текущих и депозитных счетах в гривне» и «Параметр М0»

                        ТАБЛИЦА 2. Прогнозные значения

Год

Квартал

Курс доллара США

Средства на текущих счетах в долларах США

Параметр М0

Средства на текущих и депозитных счетах в гривне

2007

I

505

10593418

28813,82289

398274185,2

 

 

 

 

 

 

Прогнозное

 

504,05

13875012

29592

443301392

MAPE

 

0,4501

31,54

6

10,85

MAD

 

2,3556

2 375 730

1514

32 158 800

 

Как видно из результатов прогнозирования, MAPE как минимум в 1,8 раза меньше для инвариантов, чем для генеральных совокупностей.

Эксперимент поставлен на обычном персональном компьютере, что обусловлено отсутствием ресурсоемкости задач. При анализе больших объемов данных можно воспользоваться распараллеливанием задач. Для анализа эффективности и построения наиболее оптимальной структуры многопоточного приложения рекомендуются оценки, приведенные в работе [6].

Заключение. Для построения более точных и актуальных прогнозов аналитику надо собирать данные по интересующим его параметрам и искать инварианты, используя корреляцию как критерий отбора. Данный подход гарантирует некоторое «качество» данных.

Для прогнозирования можно выбирать существующие прогнозы макропоказателей либо строить свои. Данная методика значительно повышает точность прогнозных значений. Аналитик может, достаточно быстро, проанализировать состояния финансовой структуры простым сравнением общегосударственных тенденций и тенденций конкретной фирмы.

Разработанная методика в перспективе может стать основой для методов KDD, которые будут автоматически искать инварианты, выбирать наиболее подходящие и строить прогнозные значения.

Back references from Стаття(і) in Проект: 
Аннотация: 

Рассмотрены построение прогнозов на микроуровне cиспользованием данных макроуровня. Рассмотрены необходимые и достаточные условия построения прогноза. Показана работоспособность метода на данных крупного Украинского банка.