Архитектура системы обработки РаБД
В этих системахреализуется децентрализованная обработка данных, т.е. базы данных находятся на компьютерах сети, на них устанавливаются локальные СУБД и можно обрабатывать данные в автономном режиме. Однако в компьютерной сети может быть создана «виртуальная» БД, объединяющая БД различных компьютеров. Она называется распределенной базой данных(РаБД). Системы управления РаБД (СУРБД) объединяют локальные БД, и любой пользователь компьютерной сети имеет доступ к ним как к единой БД.
Информация о местоположении каждой из частей РаБД находится в глобальном словаре данных, который может храниться на одном из компьютеров сети или быть распределенным. РаБД можно разделить на гомогенные, когда все локальные БД имеют одинаковые модели данных и управляются однотипной СУБД, и гетерогенные, имеющие разные модели данных и типы СУБД. Объединение гетерогенных БД является очень сложной проблемой.
Хранилища данных
Традиционный анализ данных осуществляется на основе набора готовых отчетов, а его результат – принятие определенного бизнес-решения. Для принятия эффективных управленческих решений руководителю может потребоваться исследование десятков тысяч комбинаций данных, не укладывающихся в имеющийся набор готовых отчетов. Эти проблемы легко решаются при использовании ХД. Хранилище данных (ХД) – совокупность данных, ориентированная на предметную область, интегрированная, статичная, не разрушаемая, предназначенная для поддержки принятия решений. Предметная ориентированностьозначает, что хранилище предоставляет данные, связанные с одним организационным процессом. Например, компания предоставляет клиентам услуги городской телефонной связи, мобильной связи и Интернет. Каждым видом услуг занимаются разные отделы, имеющие свои БД и создающие свои отдельные отчеты. Создание общего ХД о клиентах может обеспечить единый взгляд на приобретаемые услуги. Из него исключаются ненужные для анализа данные (индексы, номера телефонов и т.д.). Основываясь на демографических данных клиентов и тенденциях их покупательского поведения в прошлом, компания может предложить им новые услуги. Интегрированностьозначает применение единых законов именования и способов вычисления значений данных, полученных из разных источников. Например, могут использоваться несколько разных форматов представления дат или один и тот же показатель может называться по-разному, («дата выполнения» и «дата исполнения»). При записи (погружении) в ХД такие несоответствия устраняются автоматически. В процессе погружения данные: 1) очищаются – устраняется ненужная или служебная информация; 2) агрегируются – вычисляются суммы, средние значения и т.д.; 3) изменяются – происходит преобразование типов данных, реорганизация структур хранения; 4) объединяются из разных источников; 5) синхронизируются – приводятся к одному моменту времени. Статичность(независимость от времени) означает, что ХД содержит как исторические данные, так и данные, которые имели статус текущих при последнем погружении. Временные рамки данных изменяются в пределах от нескольких месяцев до нескольких лет. Неразрушаемая совокупность данныхозначает, что в ХД помещается большой объем данных, которые никогда больше не подвергаются изменениям. Т.о. пользователи, выполняющие один и тот же запрос к ХД, получат один и тот же результат. В настоящее время кроме ХД создаются витрины данных или киоски данных. Киоск данных – это небольшое ХД, обслуживающее одно из направлений бизнеса компании или одно ее структурное подразделение. Стоимость разработки киоска в десятки и сотни раз ниже стоимости корпоративного хранилища данных, а результат его внедрения окупается очень быстро.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|