Здавалка
Главная | Обратная связь

Архитектура системы обработки РаБД



В этих системахреализуется децентрализованная обработка данных, т.е. базы данных находятся на компьютерах сети, на них устанавливаются локальные СУБД и можно обрабатывать данные в автономном режиме. Однако в компьютерной сети может быть создана «виртуальная» БД, объединяющая БД различных компьютеров. Она называется распределенной базой данных(РаБД). Системы управления РаБД (СУРБД) объединяют локальные БД, и любой пользователь компьютерной сети имеет доступ к ним как к единой БД.

 

 

Информация о местоположении каждой из частей РаБД находится в глобальном словаре данных, который может храниться на одном из компьютеров сети или быть распределенным.

РаБД можно разделить на гомогенные, когда все локальные БД имеют одинаковые модели данных и управляются однотипной СУБД, и гетерогенные, имеющие разные модели данных и типы СУБД. Объединение гетерогенных БД является очень сложной проблемой.

 

 

Хранилища данных

 

Традиционный анализ данных осуществляется на основе набора готовых отчетов, а его результат – принятие определенного бизнес-решения. Для принятия эффективных управленческих решений руководителю может потребоваться исследование десятков тысяч комбинаций данных, не укладывающихся в имеющийся набор готовых отчетов. Эти проблемы легко решаются при использовании ХД.

Хранилище данных (ХД) – совокупность данных, ориентированная на предметную область, интегрированная, статичная, не разрушаемая, предназначенная для поддержки принятия решений.

Предметная ориентированностьозначает, что хранилище предоставляет данные, связанные с одним организационным процессом. Например, компания предоставляет клиентам услуги городской телефонной связи, мобильной связи и Интернет. Каждым видом услуг занимаются разные отделы, имеющие свои БД и создающие свои отдельные отчеты. Создание общего ХД о клиентах может обеспечить единый взгляд на приобретаемые услуги. Из него исключаются ненужные для анализа данные (индексы, номера телефонов и т.д.). Основываясь на демографических данных клиентов и тенденциях их покупательского поведения в прошлом, компания может предложить им новые услуги.

Интегрированностьозначает применение единых законов именования и способов вычисления значений данных, полученных из разных источников. Например, могут использоваться несколько разных форматов представления дат или один и тот же показатель может называться по-разному, («дата выполнения» и «дата исполнения»). При записи (погружении) в ХД такие несоответствия устраняются автоматически. В процессе погружения данные:

1) очищаются – устраняется ненужная или служебная информация;

2) агрегируются – вычисляются суммы, средние значения и т.д.;

3) изменяются – происходит преобразование типов данных, реорганизация структур хранения;

4) объединяются из разных источников;

5) синхронизируются – приводятся к одному моменту времени.

Статичность(независимость от времени) означает, что ХД содержит как исторические данные, так и данные, которые имели статус текущих при последнем погружении. Временные рамки данных изменяются в пределах от нескольких месяцев до нескольких лет.

Неразрушаемая совокупность данныхозначает, что в ХД помещается большой объем данных, которые никогда больше не подвергаются изменениям. Т.о. пользователи, выполняющие один и тот же запрос к ХД, получат один и тот же результат.

В настоящее время кроме ХД создаются витрины данных или киоски данных.

Киоск данных – это небольшое ХД, обслуживающее одно из направлений бизнеса компании или одно ее структурное подразделение. Стоимость разработки киоска в десятки и сотни раз ниже стоимости корпоративного хранилища данных, а результат его внедрения окупается очень быстро.

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.