2010/05/11 23:27:58

ROLAP

ROLAP (реляционная OLAP) — OLAP-системы, которые имеют прямой доступ к существующим базам данных или используют данные, выгруженные в собственные локальные таблицы.

Содержание

Общие сведения

Аналитические запросы в реляционной базе данных
Аналитические запросы в реляционной базе данных

Аналитические запросы в ROLAP строятся над виртуальным многомерным представлением данных, и их выполнение происходит на уровне реляционной базы данных, то есть выполняются SQL-запросы над реляционной системой. Основными составляющими архитектуры баз данных являются таблица фактов (fact table) и таблицы измерений (dimension tables). Таблица фактов является основной таблицей базы данных. В ней обычно содержатся сведения об объектах или событиях, совокупность которых будет подвергнута анализу. Таблицы измерений содержат постоянные либо редко изменяемые данные. Они содержат как минимум одно описательное поле и целочисленное ключевое поле для однозначной идентификации измеряемой величины. Таблица измерений обязательно должна находиться в отношении «один ко многим» с таблицей фактов; если каждое измерение находится в одной таблице измерений, то такая схема называется «звезда»(star schema). Если же хотя бы одно из измерений находится в нескольких взаимосвязанных таблицах, то такая схема построения называется «снежинка» (snowflake schema).

Условия применения

Если многомерная модель реализуется в виде реляционной базы данных, необходимо ее представлять как длинные и «узкие» таблицы фактов и сравнительно небольшие и «широкие» таблицы измерений. Таблицы фактов содержат числовые значения ячеек гиперкуба, а остальные таблицы определяют содержащую их многомерную совокупность измерений. Часть информации можно получать с помощью динамической агрегации данных, распределенных по нормализованным структурам, отличающимся по своей архитектуре от «звезды», но в этом случае включающие агрегацию запросы при высоконормализованной структуре БД могут выполняться довольно медленно. Представление многомерной информации с помощью звездообразных реляционных моделей устраняет проблему оптимизации хранения разреженных матриц, остро стоящую перед многомерными СУБД , в которых проблема разреженности решается специальным выбором схемы. Хотя для хранения каждой ячейки используется целая запись, включающая, кроме непосредственно значений, вторичные ключи — ссылки на таблицы измерений, несуществующие значения просто не включаются в таблицу фактов.

Оценка качества

ROLAP-системы имеют свои преимущества и недостатки в сравнении с многомерными системами.

Достоинства

  • реляционные СУБД могут работать с очень большими БД и имеют развитые функции администрирования. При использовании ROLAP размер хранилища не является настолько важным параметром, как в случае с MOLAP
  • при оперативной аналитической обработке содержимого хранилища данных инструменты ROLAP позволяют производить анализ непосредственно над хранилищем, ведь обычно корпоративные хранилища данных реализуются с помощью реляционных СУБД
  • при изменяющейся размерности задачи, когда изменения в структуру измерений вносятся достаточно часто, ROLAP системы с динамическим представлением размерности предстают наилучшим решением, так как в них такие манипуляции не требуют физической реорганизации БД.
  • Системы ROLAP могут функционировать на гораздо менее мощных клиентских станциях, поскольку основная вычислительная нагрузка приходится на сервер, где выполняются сложные аналитические SQL-запросы, формируемые системой
  • реляционные СУБД обеспечивают значительно более высокий уровень защиты данных и хорошие возможности разграничения прав доступа

Недостатки

  • Ограниченные возможности расчета значений функционального типа.
  • Меньшая производительность, чем у MOLAP. Для обеспечения сравнимой с MOLAP производительности реляционные системы требуют тщательной проработки схемы БД и специальной настройки индексов. Но в результате такой работы производительность хорошо настроенных реляционных систем при использовании схемы «звезда» сравнима с производительностью систем на основе многомерных БД.

См. также

Литература

  • Лабоцкий В. В. Управление знаниями: технологии, методы и средства представления, извлечения и измерения знаний — Минск: БГЭУ, 2006
  • Альперович М. Технологии хранения и обработки корпоративных данных (Data Warehousing, OLAP, Data Mining)
  • Щавелев Л. В. Способы аналитической обработки данных для поддержки принятия решений. — Открытые системы, № 4-5, 1998

Ссылки