Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Понятие распределенных БД. Хранилища данных. Свойства хранилищ данных. Технологии хранилищ данных.




Полная поддержка распределенных баз данных означает, что отдельное приложение может «прозрачно» обрабатывать данные, распределенные между множеством различных баз данных, управление которыми осуществляют разные СУБД, работающие на соединенных коммуникационными сетями машинах разных типов с различными операционными системами. Понятие «прозрачно» означает, что приложение выполняет обработку данных с логической точки хранения так, как будто управление данными полностью осуществляется одной СУБД, работающей на единственной машине.

Система распределенных баз данных состоит из набора узлов (sites), связанных коммуникационной сетью, в которой каждый узел – это полноценная СУБД сама по себе, но узлы взаимодействуют между собой таким образом, что пользователь любого из них может получить доступ к любым данным в сети так, как будто они находятся на его собственном узле. Пример подобной структуры показан на рис. ниже

1)

Распределенную систему баз данных можно рассматривать как некоторое партнерство между отдельными локальными СУБД на отдельных локальных узлах. Новый программный компонент на каждом узле – логическое расширение локальной СУБД – предоставляет необходимые функциональные возможности для организации подобного партнерства. Именно этот компонент вместе с существующими СУБД составляет то, что обычно называется распределенной системой управления базами данных.

Фундаментальный принцип распределенных баз данных (правило нуль): для пользователя распределенная система должна выглядеть так же, как нераспределенная система.

Преимущества и недостатки распределенных баз данных

 

Основная причина возникновения распределенных баз данных заключается в том, что предприятия обычно уже распределены по крайней мере логически, т.е.е разделены на подразделения, отделы, рабочие группы и т.д. Очень часто они распределены и физически, т.е. разделены на заводы, фабрики, лаборатории и т.д. Таким образом, данные также распределены, поскольку каждая организационная единица создает и обрабатывает собственные данные, относящиеся к деятельности этой единицы. Таким образом, информация предприятия разбивается на части, которые иногда называют островами информации, а распределенная система обеспечивает мосты для их соединения в единое целое. Таким образом, одним из важнейших преимуществ распределенных баз данных является возможность отражения ими структуры предприятия.

Кроме того, к преимуществам распределенных баз данных можно отнести эффективность обработки (данные хранятся в том месте, где доступ к ним требуется наиболее часто) и расширенные возможности доступа (при необходимости с помощью коммуникационной сети можно получить данные из одного узла в другом).

Основным недостатком подобных систем, очевидно, является повышенная сложность, по крайне мере с технической точки зрения. В идеальном случае, эта сложность должна быть проблемой реализации, а не проблемой пользователя, но вполне возможно, что на практике некоторые ее аспекты все-таки будут видны конечным пользователям.

Существующие примеры распределенных систем являются реляционными. Более того, существует несколько конкретных причин, по которым для успешной реализации распределенная система должна быть реляционной.

 

Проблемы распределенных систем

 

Ключевая проблема распределенных систем состоит в том, что коммуникационные сети, по крайне мере сети с большой протяженностью или глобальные сети остаются пока что относительно медленными. Поэтому основная задача распределенных систем – минимизировать использование сетей, т.е. минимизировать количество и объем передаваемых сообщений. Эта проблема в свою очередь сталкивается со следующими проблемами:

Обработка запросов – чтобы решить задачу минимизации использования ресурсов сети, процесс оптимизации запросов должен быть распределенным, как и процесс выполнения запросов

Управление каталогом – в распределенной системе каталог БД включает не только данные, соответствующие базовым переменным-отношениями, представлениям, полномочиям и т.д., но также всю необходимую управляющую информацию, которая позволит системе обеспечить независимость от размещения, фрагментации и репликации.

Распространение обновлений – обновление любого заданного логического объекта должно распространяться на все хранимые копии этого объекта (это можно назвать основной проблемой репликации данных). Общая схема решения рассматриваемой проблемы состоит в использовании схемы первичной копии.

Управление восстановлением – обычно базируется на протоколе двухфазной фиксации транзакций (или на некоторых его вариантах)

Управление параллельностью – управление параллельным доступов в большинстве распределенных систем строится на использовании механизма блокирования, т.е. точно также, как и в большинстве нераспределенных систем.










Последнее изменение этой страницы: 2018-05-29; просмотров: 270.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...