Хранилища данных на реляционном каркасе

Опубликовано: 
Управляющие системы и машины, №1, 2013 год

 В работе предложен новый подход к моделированию темпоральных баз данных (БД). Показано, что классическая реляционная схема хранилища данных (ХД) «снежинка» является частным случаем реляционного каркаса. Делается вывод о возможности одновременного использования каркасной БД и как оперативного, и как аналитического ХД. Введено понятие корректной модификации данных и метаданных. Приводятся результаты численного эксперимента доступа к БД

ВложениеРазмер
Panchenko-HD-RK-USIM-1-2013.doc369.5 КБ
Аннотация: 

  Потребность в моделировании темпоральности данных вызвана динамическим характером функционирования любой системы. Исторически это было важной причиной разделения всех приложений баз данных (БД) на 2 типа - оперативные, в которых моделирование времени может быть минимизировано, и исторические, в которых время играет принципиальную роль. Эти БД получили соответствующие названия – «оперативные» (или «транзакционные») и «хранилища» (или «аналитические»).

  Принцип хранилищ данных (ХД) и их определение предложил У. Инмон. В его подходе ХД — это «предметно-ориентированная, интегрированная, содержащая исторические данные, целостная совокупность данных, предназначенная для поддержки принятия управленческих решений». Инмон дал и классификацию ХД. Из описанных типов нас более всего будет интересовать виртуальное хранилище.

  Виртуальное ХД — это система, предоставляющая интерфейсы и методы доступа к оперативно-регистрирующей системе, которые эмулируют работу с данными как с ХД. Это означает, что виртуальное ХД можно организовать, создав ряд «обращений» (view) к БД, либо применив специальные средства доступа.

   Главными достоинствами такого подхода являются простота и малая стоимость реализации, единая платформа с источником информации и отсутствие сетевых соединений между источником информации и ХД. При этом хранилище, организованное в соответствии с каркасной схемой БД, избавлено от большинства недостатков. Схема такого ХД и приложения, его обслуживающие,  могут быть динамически модифицируемы. А высокая производительность такой системы обеспечивается минимизацией операций соединения.

   Следовательно, и модифицируемость схем БД, и интеграция данных с другими источниками, и отслеживание исторических измерений, и подобие схем БД, и гарантии чистоты данных, обеспечиваемые ограничениями на домены и ключи, позволяют сделать вывод о том, что объединение свойств оперативной (OLTP) и архивной (OLAP) БД в одной каркасной схеме становится возможным.