Автоматическое построение числовых прогнозов

Інші автори: 
Харченко А.В.
Опубликовано: 
Компьютерная математика. 2010, № 2

Вступление

В условиях рыночной экономики предприятия нуждаются в построение прогнозов различных показателей для построения планов своей деятельности (бизнес-планирование) [1]. Даже учитывая нестабильный характер экономики в Украине, актуальность такой проблемы не ослабевает [2]: для прогнозирования развития ситуации можно построить несколько прогнозов по различным сценариям и спланировать развитие предприятия для каждого из них [3-7].

На рынке программных продуктов представлено несколько пакетов статистического прогнозирования [8]. Каждый из этих пакетов имеет свои преимущества и недостатки, но, поскольку методы прогнозирования числовых рядов разработаны в 1960-70-х годах, перечень реализованных методов часто совпадает. Даже пользователю с основательной математической подготовкой среди предложенных средств зачастую трудно отыскать наиболее адекватное решению его задач. При выборе инструмента прогнозирования следует учесть математическую подготовку пользователя, время, затраченное на подбор оптимальной модели, затраты на изучение интерфейса нового программного продукта.

Режимы работы пакета PREDICTOR

PREDICTOR представляет собой развитую систему интерактивного прогнозирования, встраиваемую в MS-Excel,

имеющую для пользователя 4 режима сложности обработки.

  1. Для новичков режим Мастер позволяет быстро получить прогноз путем пошаговых операций установления сезонности, выбора метода (модели), визуального контроля качества работы модели и записи результата в виде ряда чисел. При этом оптимальные величины всех необходимых параметров PREDICTORподбирает автоматически, так что пользователь имеет возможность и не знать их назначения;
  2. Для квалифицированных пользователей диалоговая среда итеративного прогнозирования представляет собой иногда намного более длительный процесс, нежели экспресс-прогнозирование, однако его преимущество состоит в том, что пользователь может "конструировать" прогноз путем тонкой коррекции параметров после их автоматического подбора системой, сравнения альтернативных вариантов прогноза одного и того же ряда (визуального и количественного, используя статистические показатели) и сохранения полученной таким образом эмпирической модели прогнозирования одних данных для использования ее с другими данными, описывающими процессы сходной природы;
  3. В режиме функций электронной таблицы предполагается, что параметры прогнозной модели уже определены и необходимо обеспечить, чтобы результаты прогнозирования сами являлись исходными данными для последующих вычислений в электронной таблице; при этом необходимо, чтобы при изменении исходных данных, которые не являются результатом каких-либо вычислений, происходил автоматический пересчет всех зависимых от них звеньев, в частности результатов прогноза, - вот почему модели на этом уровне организованы в виде функций MS-Excel. PREDICTORрасполагает 25 методами прогнозирования, среди которых: простые и линейные скользящие средние; сглаживание: простое, адаптивное, линейное по Холту, линейное по Брауну, квадратичное по Брауну, аддитивное сезонное по Винтерзу, сезонное по Холту-Винтерзу, сезонное по Брауну-Харриссону; регрессия: авторегрессия, S-кривые, кривая Гомпертца, логистическая кривая, популярные и определяемые пользователем тренды; методология Бокса-Дженкинса [5], ARARMA, ARIMA-модели с сезонностью в ARи MA, обобщенная адаптивная фильтрация (GAF); множественная регрессия; интерполяционные аппроксимационные нейронные сети [6, 7].
  4. Быстрое получение прогноза даетпакетное прогнозирование, в процессе которого пользователю необходимо указать только источник данных, длину прогноза, общие параметры, характеризующие временной ряд и выбрать методы для тестирования из предложенного списка. Более квалифицированный пользователь может настроить весовые коефициенты статистических оценок, по которым ведется отбор оптимального метода. Оптимальные параметры, метод десезонирования пакет подбирает автоматически, тестируя при этом полученную модель, а в конце работы предлагает список из 4-х оптимальных методов, прогнозы построенные с их применением – т.е. дает возможность автоматически получить результат с минимальным числом шагов.

Поддержано динамическое прогнозирование по мере поступления новых данных, управление сценариями и повторное использование сценариев. Система поставляется с подробной документацией и множеством примеров. Пакет PREDICTORинтегрирован в MSEXCELи изначально задуман как средство, объединяющее простоту и наглядность электронных таблиц и мощные возможности методов численного прогнозирования.

В первую очередь пакет ориентирован на пользователей, которые имеют минимальные познания в области численного прогнозирования и хотят быстро получить результат на конкретном числовом ряду данных (например, менеджеры). Для такой категории людей наиболее информативными есть визуальные методы отображения данных (графики, диаграммы, использование различных цветов для подсветки лучших и худших характеристик из общего списка для того или иного метода). При разработке и реализации данных режимов использовались основные принципы построения стандартных мастеров пакета MicrosoftOfficeи программы MSExcelв частности.

Полная последовательность шагов для построения прогноза с помощью PREDICTOR

Шаг 1. Ввод данных

Шаг 2. Выбор сезонности данных.

Шаг 3. Выбор длины прогнозного горизонта

Шаг 4. Выбор методов прогнозирования.

Шаг 5. Подбор параметров метода

Шаг 6. Подбор метода сезонной декомпозиции.

Шаг 7. Тестирование выбранного метода

Шаг 8. Прогнозирование выбранным методом и вставка результата в электронную таблицу.

При работе в режиме Мастер пользователь должен пройти все шаги 1-8 самостоятельно и на каждом шаге он может как принять, предложенные пакетом параметры, так и откорректировать их. В режиме Эксперт пользователь может выполнить тот же пошаговый процесс получения прогноза, но используя кнопки на панели управления процессом прогнозирования. В то же время можно менять порядок выполнения шагов произвольно. Те модели методов прогнозирования, которые дают приемлемые результаты (на данный момент являются лучшими) можно запомнить для повторного использования. Такую возможность пользователь получает по кнопке История. В соответствующем диалоговом окне необходимо отметить список необходимых моделей методов и сохранить результат в виде отдельного файла. Информацию из этого файла можно использовать в дальнейшей работе, пополнять и обновлять в случае необходимости. Если же пользователь начинает новый сеанс работы с пакетом, то работу можно продолжить с учетом предыдущих изысканий, воспользовавшись для вызова пакета третьей кнопкой на панели инструментов Predictorс именем Продолжить, по которой после выбора данных необходимо будет выбрать файл, в котором сохранены лучшие модели методов (*.mem). Доступ к нужным моделям методов можно получить по той же кнопке История.

Пакетный режим предлагает пользователю пошагово пройти часть процесса построения прогноза - от выбора данных до выбора методов прогнозирования,остальные шаги пакет преодолевает автоматически. На каждом шаге, как и в режиме Мастер предлагается помощь (кнопка Помощь), выход из пакета (Отменить), переход на следующий шаг (Дальше) и возврат на предыдущий (Назад) - традиционный набор кнопок окна мастера.

Автоматическое построение прогнозов в пакетном режиме

Рассмотрим подробнее сеанс работы в пакетным режиме. Данные должны быть заранее внесены в рабочую таблицу MSExcel. После этого их необходимо маркировать и на панели инструментов PREDICTOR  выбрать кнопку Пакетный режим.

Шаг 1. Открывается диалоговое окно с адресом маркированной области. Необходимо подтвердить выбор данных или скорректировать эту область по своему усмотрению.

Шаг 2. Выбр сезонности данных. Необходимо просто указать, какой период имеют данные: представлены ли они по месяцам, кварталам, годам или неделям. При этом соответствующее числовое значение выбирается автоматически Есть возможность ввести просто число, если период  выбранного ряда данных не входит в вышеуказанный перечень.

Шаг 3. Длина прогноза. Выбирается число шагов на которые строится прогноз. Это же количество последних точек в режиме тестирования (шаг 7) не используется как исходные данные, а остается для тестирования модели (на них строится предварительный прогноз). От выбранной длины прогноза будущий выбор метода прогнозирования не зависит, но следует учесть, что это число может превысить длину доверительного интервала выбранного метода.

Шаг 4. Выбор метода прогнозирования. Предлагается общий список, в котором маркированы методы, пригодные для прогнозирования выбранного ряда (отбор ведется пакетом автоматически по заданным на предыдущих шагах параметрам и встроенным функциям анализа выбранного ряда), а пользователь имеет возможность скорректировать данный список (как расширить так и сократить его). Весь дальнейший процесс тестирования и отбора наиболее подходящих методов производится автоматически.

Автоматизация подбора оптимального метода возможна за счет встраивания в пакет средств интеллектуальной поддержки работы пользователя. Одним из таких средств является  интегральная оценка, которая является авторской разработкой создателей пакета (Харченко А.В.).

Задача, решаемая посредством оценок качества. Мотивация интегральной оценки ИО. Свойства  как критерий активного обучения

...

Т.о. введение интегральной оценки существенно упрощает отбор оптимальной модели для численного прогнозирования, а именно включение ее как составляющей части пакета дает возможность автоматизации процесса оценивания предложенных моделей, значит, и отбора оптимальной. Пакет PREDICTORобеспечивает такую возможность автоматического получения прогнозов с подбором лучшего метода, максимально точной настройкой его параметров  и отбора лучшей модели по интегральным критериям.

Пример прогнозирования цен на продукты питания.

Рассмотрим простоту работы пакета на примере прогнозирования цен на подсолнечное масло (данные за 2000-2001 года):

В режиме Пакетное прогнозирование необходимо выбрать область данных, после чего будет задано пару уточняющих вопросов о сезонности и длинне необходимого прогноза:

Рис. 1. Выбор области данных.

Система проводит тестирование, выбирает 4 лучших метода, выполняет прогнозирование выбранными методами и вставку результата в электронную таблицу.

Рис. 2. Результат прогноза.

Результат прогнозирования по выбранным 4-м лучшим методам приведен в таблице 2. Таблица 1. Результат работы Predictor

Подсолнечное масло

ARIMA 1 0 0

ARIMA-AR 1 0 0 1

ARARMA 1 0 1

Winters 0.80 0 0.30

64537.00

64537.00

64537.00

64537.00

64537.00

94597.00

64901.14

58390.10

62280.78

60353.23

 

90153.49

94912.95

83383.21

101565.13

 

85918.71

87433.50

69623.76

87603.45

 

81882.84

84396.26

65125.23

99101.00

 

По каждому методу можно настроить множество параметров статистики, по которой можно сравнить выбранные методы. Пример статистики приведен в Таблице 3.

Таблица 2. Отображение параметров статистики.

 

ARIMA 1 0 0

ARIMA-AR 1 0 0 1

ARARMA 1 0 1

Winters 0.80 0 0.30

DW

2.036310059

1.990477097

1.916739173

1.977068769

R2

0.166439353

0.179470748

0.313953139

0.026398051

AIC

0.484013495

0.48363533

0.481339243

0.491740601

BIC

488.3696031

487.9914375

490.0514581

504.8089244

HQ

484.3260335

483.9478678

481.9643189

492.6782155

 

При необходимости можно моделировать ситуацию, изменяя параметры полученной модели:

Рис. 3. Изменение параметров модели.

Иногда данные состоят из нескольких связанных рядов. Например, прогнозируя уровень цен на подсолнечное масло в качестве дополнительных рядов выбирем цены на другие товары первой необходимости: маргарин, мыло хозяйственное и туалетное. Пакет автоматически подбирает 4 лучших метода, используя для тестирования методы, работающие с множественными рядами.

В примере пользователь, работая в привычной среде Excelсвоей предметной области, просто и эффективно использует мощный инструмент прогнозирования данных, по ходу вычислений приобретая навыки прогнозирования данных.

Особенности использования пакета PREDICTOR

Пакет предполагает автоматическую инсталляцию; необходимо только указать версию Excel, с которой будет взаимодействовать пакет, и выбрать конфигурацию установки (руководство пользователя, примеры и Мастер). Файлы, необходимые для дальнейшей работы (рабочие книги  -*.xls, библиотечные файлы -*.dll, файлы справочной системы - *.hlpи т.д.) будут скопированы в стандартные подкаталоги EXCELи WINDOWS. Все необходимые настройки также будут проведены автоматически - создается и включается панель инструментов PREDICTORс набором кнопок для различных способов запуска пакета, создается и включается в работу дополнение (надстройка, Add-Ins)

ЗАКЛЮЧЕНИЕ

Среди разнообразных методов прогнозирования предпочтение отдается программным продуктам, способным легко строить прогноз и выбирать наилучшие модели для начальных данных. Так, в [8] приведен анализ пакетов, облегчающих разработки прогнозов по 12 группам критериев. Кроме сравнительного анализа, таблицы 2 и 3 источника [8] свидетельствуют, что практически каждый программный продукт может записать результат в таблицы Excelи из них импортировать данные для работы. Но ведь экспорт/импорт данных зачастую связан с побочными проблемами нестыковки форматов данных.

Отличительной чертой пакета Predictorявляется удобство пользовательского интерфейса, когда построение  прогноза перерастает в процесс моделирования с подсказками компьютера о подходящих методов прогнозирования, с автоматическим сравнением моделей и выбором оптимальной модели прогноза. А подготовку и преобразование входных данных автоматически выполняют утилиты пакета.

Начаты работы по переводу пакета Predictorна вычислительные кластеры СКИТ-3 и Инпарком, на которых параллельно можно будет одновременно считать все (или несколько) моделей и обрабатывать сотни файлов данных, содержащих сотни тысяч наблюдений, что увеличит производительность пакета. В связи с тем, что методы прогнозирования связаны с обработкой матричных данных (особенно AR), то такие методы достаточно просто распараллелить.

 

Лавренюк С.І., Перевозчикова О.Л., Тульчинський В.Г., Харченко А.В.

АВТОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ЧИСЛОВЫХ ПРОГНОЗОВ

Розглянуто можливості автоматичної побудови прогнозів з використанням пакету статистичного прогнозування PREDICTOR, описані та обгрунтувані інтелектуальні засоби пакету, якими володіє цей продукт, насамперед засоби інтегральної оцінки, що дозволяє ранжувати отримані прогнози. Наведені приклади побудови прогнозів на основі реальних числових рядів.

Lavreniuk, S.I., Perevozhikova, O.L.,Tulchinsky, V.G., KharchrenkoA.V.

ON AUTOMATICAL GENERATION OF NUMERIC FORECASTS

The abilitiesof automatical forecasting with use of  the statistical forecasting packadge PREDICTOR are examined. Intelligent packadge tools of the product, primary the integrated estimating method enabling the resulted forecast ranging, are described and proved. Real time series forecasting examples are proposed.

ЛИТЕРАТУРА.

1. Савицкая Г.В. Теория анализа хозяйственной деятельности – Учебник. ИНФРА-М, 2007, - 288c.

2. “Проект Закону про державне прогнозування та стратегічне планування в Україні», від 16.03.2010 №6198 //http://gska2.rada.gov.ua

3. Холден К., Пiл Д.А., Томпсон Дж.Л. Економiчне прогнозування: вступ. - К.: Iнформтехнiка-ЕМЦ, 1996. - 216 с.

4. Интеллектуальные пакеты статистического прогнозирования / О.Л Перевоз­чикова, И.Н Пшoнковская, Т.К. Терзян, В.Г. Тульчинский и др. // Упр. системы и машины. - 1997. - N6. - C. 56-67.

5. Box G. E. P., Jenkins G. M. Time Series Analysis Forecasting and Control. –  San Francisco:Holden-Day, Inc., 1970.

6. Cohn D.A., Ghahramani Z., Jordan M.I. Active Learning with Statistical Models // Journal of Artificial Intelligence Research. – 1996. – № 4. – P. 129-145.

7. Geman S., Bienenstoak E., Doursat R. Neural networks and the bias/variance dilemma // Neural Computation. – 1992. – № 4. – P. 1-58.

8. http://www.nickart.spb.ru/clause/text_07.php

И увеличения, таким образом, качества прогнозной модели – путем не включения в модель ряда моделей всех локальных зависимостей, кроме хронологически последней.

Back references from Стаття(і) in Проект: 
Аннотация: 

Рассмотрены возможности автоматического получения прогнозов с использование пакета статистического прогнозирования PREDICTOR, описаны и обоснованы интеллектуальные средства пакета, в частности средства интегральной оценки, позволяющей оценивать и ранжировать полученные прогнозы. Приведены примеры построения прогнозов на основе реальных временных рядов.