Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Операції маніпулювання вимірами




СХОВИЩА ДАНИХ ТА OLAP-СИСТЕМИ

 

для студентів

 напрямку 6.050103 - Програмна інженерія

 

ОДЕСА ОНПУ 2017


Міністерство освіти та науки України

Одеський національний політехнічний університет

 

 

МЕТОДИЧНІ ВКАЗІВКИ

ДО ЛАБОРАТОРНИХ РОБІТ

з дисципліни


СХОВИЩА ДАНИХ ТА OLAP-СИСТЕМИ

 

для студентів

напрямку 6.050103 - Програмна інженерія

 

 

Затверджено

на засіданні кафедри

системного програмного забезпечення

Протокол № 8   від  16.01.2017

 

 

ОДЕСА ОНПУ 2017


 

Методичні вказівки до лабораторних робіт з дисципліни «Сховища даних та OLAP-системи» для студентів спеціальності 6.050103 – Програмна інженерія / Укл. С.Л. Зіноватна, Ю.М. Возовіков. – Одеса; ОНПУ, 2017. – 31 с.

 

 


Зміст

Вступ. 3

Лабораторна робота №1 Робота зі зведеними таблицями. 4

Лабораторна робота №2 Створення простих багатомірних OLAP кубів. 8

Лабораторна робота №3 Аналіз даних з використання багатомірного кубу. 16

Лабораторна робота №4 Побудова OLAP зрізів куба клієнтським засобом.. 19

Лабораторна робота №5 Підготовка реляційної БД як джерела даних для сховища даних. 20

Лабораторна робота №6 Створення сховища даних на основі реляційної БД за заповнення його даними 25

Лабораторна робота №7-8 Мова багатомірних виражень MDX (Multi-Dimensional eXpressions) 27

Література. 31

 

Вступ

 

Метою лабораторних занять є одержання навичок по проектуванню багатомірних кубів, які є основою сховища даних.

У процесі виконання робіт студент повинен освоїти принципи побудови багатомірних кубів, процедури завантаження даних з джерел даних до сховища, навчитися писати створювати запити для витягу даних з багатомірного кубу.

Лабораторна робота №1
Робота зі зведеними таблицями

Мета роботи: освоїти роботу з зведеними таблицями в редакторі електронних таблиць


Теоретичні основи

Звіт зведеної таблиці являє собою інтерактивний метод швидкого підсумовування більших обсягів даних. Звіт зведеної таблиці використається для докладного аналізу числових даних і для відповідей на непередбачені питання за даними. Звіт зведеної таблиці спеціально призначений для наступного:

- організації запитів до великих масивів даних дружніми стосовно користувача способами;

- підведення проміжних підсумків і застосування статистичних функцій до числових даних, підсумовування даних по категоріях і підкатегоріях, а також для створення додаткових обчислень і формул;

- розгортання й згортання рівнів подання даних для залучення уваги до результатів, а також розгортання звітів з метою одержати докладні відомості з підсумкових даних по потрібних областях;

- переміщення рядків у стовпці або стовпців у рядки (або "відомість") для перегляду різних зведених даних за вхідним даними;

- фільтрації, сортування, угруповання й умовного форматування найбільш важливих і часто використовуваних підмножин даних для залучення уваги до потрібних відомостей;

- подання коротких, наочних й анотованих звітів у мережі або в надрукованому виді.

Звіт зведеної таблиці використається у випадках, коли потрібно проаналізувати зв'язані підсумки, особливо для порівняння декількох фактів по кожному числу з довгого списку чисел, що узагальнюють.

У звіті зведеної таблиці кожен стовпець або поле вихідних даних стає полем зведеної таблиці, у якому підводять підсумки декількох рядків.

Способи роботи зі звітом зведеної таблиці

Після створення початкового звіту зведеної таблиці шляхом завдання джерела даних, розподілу полів у списку полів зведеної таблиці й вибору вихідного макета діаграми при роботі зі звітом зведеної таблиці часто виконуються наступні дії.

Вивчення даних. Для цього використаються наступні засоби.

- розгортання й згортання даних і відображення докладних відомостей про значення;

- сортування, фільтрація й угруповання полів й елементів;

- внесення змін у функції підведення підсумків і додавання додаткових обчислень і формул.

Зміна макета. Для цього використаються наступні засоби.

- зміна форми звіту зведеної таблиці: компактної, табличної або структурної;

- відображення підсумків над або під рядками даних;

- переміщення поля стовпця в область рядків або поля рядка в область стовпців;

- зміна відображення помилок, порожніх осередків, а також елементів і підписів, не утримуючих дані;

- зміна порядку полів або елементів; додавання, зміна розташування й видалення полів;

- завдання ширини стовпця при відновленні;

- відключення або включення відображення заголовків полів стовпців і рядків, а також відображення або приховання порожніх рядків.

Зміна формату. Для цього використаються наступні методи.

- умовне форматування й форматування вручну осередків і діапазонів;

- зміна загального стилю форматування зведеної таблиці;

- зміна числа форматів для полів, а також форматування сервера OLAP.

Завдання

Номер варіанта дорівнює (N mod 5) +1, де N - номер студента за списком групи.

Варіант 1

Створити робочу книгу для зберігання інформації про виконання проектів по зовнішній рекламі для різних клієнтів, у кожному проекті може бути задіяне кілька матеріалів.

Книга повинна містити кілька аркушів з однаковою структурою. Кожен аркуш містить інформацію про проекти, замовлених протягом одного календарного року. Ім'я аркуша відповідає значенню року.

Кожен аркуш включає наступну інформацію. У верхній частині аркуша втримується сьогоднішнє число, курс валюти й рік, до якого ставляться дані поточного аркуша.

Нижче розташована таблиця з наступними полями:

  1. Назва проекту
  2. Назва клієнта
  3. Адреса
  4. Дата початку проекту
  5. Квартал
  6. Назва матеріалу
  7. Одиниця виміру
  8. Ціна одиниці матеріалу в у.о.
  9. Ціна в грн
  10. Кількість
  11. Загальна вартість матеріалу в у.о.
  12. Загальна вартість матеріалу в грн

Значення поля Квартал обчислюється залежно від дати, значення поля Ціна в грн обчислюється залежно від курсу, зазначеного у верхній частині аркуша, значення полів Загальна вартість матеріалу в у.о. и Загальна вартість матеріалу в грн обчислюються з урахуванням кількості матеріалу.

На кожному аркуші розмістити зведену таблицю, сторінки якої відповідають кварталам, рядки - матеріалам, стовпці - назвам клієнтів, і що відображає, на яку суму для кожного клієнта використано матеріалів.

 

Варіант 2

Створити робочу книгу для зберігання інформації про продаж товарів, кожен вид товару може бути проданий неодноразово різним клієнтам.

Книга повинна містити кілька аркушів з однаковою структурою. Кожен аркуш містить інформацію про товари, проданих протягом одного календарного місяця. Ім'я аркуша відповідає номеру місяця.

Кожен аркуш включає наступну інформацію. У верхній частині аркуша втримується сьогоднішнє число й назва місяця, до якого ставляться дані поточного аркуша.

Нижче розташована таблиця з наступними полями:

  1. Назва товару
  2. Назва клієнта
  3. Дата
  4. Номер тижня
  5. Кількість товару
  6. Вхідна ціна
  7. Ціна продажу
  8. Загальна вартість замовлення
  9. Прибуток
  10. Оплата
  11. Борг

Значення поля Номер тижня (у межах місяця) обчислюється залежно від дати, значення поля Загальна вартість замовлення обчислюється залежно від кількості й ціни продажу, значення поля Прибуток обчислюється як різниця між цінами з урахуванням кількості товару. Значення поля Борг обчислюється як різниця загальної вартості й оплаченої суми.

На кожному аркуші розмістити зведену таблицю, сторінки якої відповідають товарам, рядки – назвам клієнтів, стовпці - номерам тижнів, і що відображає, яку суму оплатив кожен клієнт за кожній тиждень

 

Варіант 3

Створити робочу книгу для зберігання інформації про виробництво продукції, кожен вид продукції може бути випущений кілька разів протягом місяця, в один день може випускатися кілька видів продукції.

Книга повинна містити кілька аркушів з однаковою структурою. Кожен аркуш містить інформацію про продукцію, випущеної протягом одного календарного місяця. Ім'я аркуша відповідає назві місяця.

Кожен аркуш включає наступну інформацію. У верхній частині аркуша втримується сьогоднішнє число й назва місяця, до якого ставляться дані поточного аркуша.

Нижче розташована таблиця з наступними полями:

  1. Дата
  2. Вид продукції
  3. Одиниця виміру
  4. Кількість
  5. Собівартість
  6. Кількість браку
  7. Відсоток браку від випущеної кількості
  8. Загальна вартість випущеної продукції
  9. Планова кількість
  10. Назва цеху
  11. Недовиконання/Перевиконання по кількості
  12. Недовиконання/Перевиконання за вартістю

Значення поля Відсоток браку від випущеної кількості обчислюється автоматично залежно від випущеної кількості, значення поля Загальна вартість обчислюється залежно від випущеної кількості й собівартості, значення поля Недовиконання/ Перевиконання обчислюється як різниця між плановою кількістю й випущеною кількістю значення за вартістю обчислюється з урахуванням собівартості.

На кожному аркуші розмістити зведену таблицю, сторінки якої відповідають назвам цехів, рядки - датам, стовпці - видам продукції, і що відображає, яка вартість випущеної продукції за кожний день

 

Варіант 4

Створити робочу книгу для зберігання інформації для обліку роботи водіїв таксопарку, кожен водій може працювати кілька днів на місяць, різні зміни можуть працювати на різних машинах.

Книга повинна містити кілька аркушів з однаковою структурою. Кожен аркуш містить інформацію про зміни, виконані одним водієм. Ім'я аркуша відповідає табельному номеру водія.

Кожен аркуш включає наступну інформацію. У верхній частині аркуша втримується сьогоднішнє число, розмір відрахування з даного водія на користь таксопарку у відсотках і прізвище водія, до якого ставляться дані поточного аркуша.

Нижче розташована таблиця з наступними полями:

  1. Номер машини
  2. Марка машини
  3. Дата
  4. Час початку зміни
  5. Тривалість зміни в годинниках
  6. Номер зміни
  7. Виторг
  8. Середнегодиннийвиторг
  9. Відрахування на користь таксопарку
  10. Залишок на руки

Значення поля Зміна обчислюється автоматично залежно від часу початку зміни (з 6.00 до 12.00 - 1-я зміна, з 12.00 до 18.00 - 2-я зміна, з 18.00 до 24.00 - 3-я зміна), значення поля Середнегодинний виторг обчислюється залежно від суми виторгу й тривалості зміни. Значення поля Відрахування на користь таксопарку обчислюється залежно від відсотка відрахування водія й виторги. Поле Залишок на руки обчислюється як різниця між виторгом і відрахуванням парку.

На кожному аркуші розмістити зведену таблицю, сторінки якої відповідають номерам змін, рядки - датам, стовпці - номерам машин, і що відображає, який сумарний виторг кожної машини за кожний день

 

Варіант 5

Створити робочу книгу для зберігання інформації про виплати заробітної плати співробітникам підприємства, кожен співробітник одержує зарплату неодноразово, у кожному відділі кілька співробітників.

Книга повинна містити кілька аркушів з однаковою структурою. Кожен аркуш містить інформацію про зарплату співробітникам одного відділу. Ім'я аркуша відповідає номеру відділу.

Кожен аркуш включає наступну інформацію. У верхній частині аркуша втримується сьогоднішнє число, розмір прибуткового податку у відсотках і назва відділу, до якого ставляться дані поточного аркуша.

Нижче розташована таблиця з наступними полями:

  1. Дата
  2. Місяць
  3. Прізвище
  4. Посада
  5. Кількість відпрацьованих годин
  6. Погодинна оплата
  7. Нарахована зарплата
  8. Прибутковий податок
  9. Відсоток премії
  10. Розмір премії в грн
  11. Сума на руки

Значення поля Місяць обчислюється автоматично залежно від дати, значення поля Нарахована зарплата обчислюється залежно від кількості відпрацьованих годин і погодинної оплати. Значення поля Прибутковий податок обчислюється залежно від відсотка прибуткового податку. Поле Розмір премії обчислюється залежно від  відсотка премії й нарахованої зарплати. Значення поля Сума на руки обчислюється як сума нарахованої зарплати й премії й різниця прибуткового податку.

На кожному аркуші розмістити зведену таблицю, сторінки якої відповідають посаді, рядки - номерам місяців, стовпці - прізвищам співробітників, і що відображає, яку суму одержав кожен співробітник щомісяця.

 

Зміст протоколу:

1. Ціль роботи

2. Завдання

3. Скріншоти усіх аркушів книги.

4. Висновок

 

Контрольні питання:

1. Що таке зведена таблиця?

2. Для чого використовується зведена таблиця?

3. Способи роботи зі звітом зведеної таблиці

 

 

Лабораторна робота №2
Створення простих багатомірних OLAP кубів

 

Мета роботи: одержання навичок у створенні простих багатомірних OLAP кубів, з використанням програмного продукту icCube.

 


Теоретичні основи

Коли говориться про багатомірну організацію даних, не мається на увазі те, що дані представляються кінцевому користувачеві у вигляді чотирьох або п’ятивимірних гіперкубів. Коли говориться про багатомірність, мається на увазі не багатомірність візуалізації, а багатомірне подання при описі структур даних і підтримка багатомірності в мовах маніпулювання даними.

Основними поняттями багатомірної моделі даних є: вимір (Dіmensіon) і показник (Measure).

Вимір - це множина однотипних даних, утворюючих одну із граней гіперкуба. Наприклад - Дні, Місяці, Квартали, Роки. Прикладами географічних вимірів є: Міста, Райони, Регіони, Країни й т.д. У багатомірній моделі дані виміри відіграють роль індексів, використовуваних для ідентифікації конкретних значень (показників), що перебувають в осередках гіперкуба.

Показник - це поле (звичайно цифрове), значення якого однозначно визначаються фіксованим набором вимірів. 

OLAP-сервери можуть зберігати багатомірні дані по-різному. У будь-якому сховищі даних - і у звичайному, і в багатомірному - поряд з детальними даними, що витягають із оперативних систем, зберігаються й сумарні показники (агреговані показники, агрегати), такі, як суми обсягів продажів по місяцях, по категоріях товарів і т.п. Агрегати зберігаються в явному виді з єдиною метою - прискорити виконання запитів. Адже, з одного боку, у сховищі накопичується, як правило, дуже великий обсяг даних, а з іншого боку - аналітиків у більшості випадків цікавлять не детальні, а узагальнені показники. І якщо щораз для обчислення суми продажів за рік довелося б підсумувати мільйони індивідуальних продажів, швидкість, швидше за все, була б неприйнятною.

Але прискорення обробки запитів відбувається за рахунок збільшення як обсягів даних, так і часу на їхнє завантаження. Причому збільшення обсягу може стати "вибухообразним". Ступінь "розбухання" даних при обчисленні агрегатів залежить від кількості вимірів куба й структури цих вимірів, тобто співвідношення кількості "батьків" й "дітей" на різних рівнях виміру.

Як детальні дані, так й агрегати можуть зберігатися або в реляційних, або в багатомірних структурах. Багатомірне зберігання дозволяє звертатися з даними як з багатомірним масивом, завдяки чому забезпечуються однаково швидкі обчислення сумарних показників і різні багатомірні перетворення по кожному з вимірів.

Операції маніпулювання вимірами

Формування зрізу. Користувача рідко цікавлять все потенційно можливі комбінації значень вимірів. Підмножина гіперкуба, яка вийшла в результаті фіксації значення одного або більше вимірів, називається зрізом (Slіce).

Операція обертання. Зміна порядку подання (візуалізації) вимірів (звичайно застосовується при двомірному поданні даних) називається Обертанням (Rotate). Ця операція забезпечує можливість візуалізації даних у формі, найбільш комфортної для їхнього сприйняття.

Відносини й ієрархічні відносини. В кубі може бути багато вимірів й між їхніми значеннями звичайно існує множина різних відносин (Relatіon) типу "один до багатьох". Для вимірів, що мають тип Час (таких як День, Місяць, Квартал, Рік), всі відносини встановлюються автоматично, і їх не потрібно описувати. У свою чергу, мноєина відносин може мати ієрархічну структуру - ієрархічні відносини (Hіerarchіcal Relatіonshіps).

Операція агрегації. У процесі аналізу користувач не тільки працює з різними зрізами даних і виконує їхнє обертання, але й переходить від деталізованих даних до агрегованих, тобто робить операцію агрегації (Drіll Up).

Операція деталізації. Перехід від більше агрегованих до більше деталізованих даних називається операцією деталізації (Drіll Down).

Хід роботи:

У даній лабораторній роботі необхідно на підставі існуючої реляційної БД (FoodMart) побудувати OLAP куб для аналізу показників продажів різних продуктів, у різних країнах і за різні проміжки часу. Як показники беруться значення із БД - Store Cost, Store Sales, Unіt Sales.

Як виміри і їхні ієрархії використаються:

· Product – категорія продукту, підкатегорія продукту й назва торговельної марки;

· Region – країна, регіон, провінція, район, місто;

· Time – рік, квартал, місяць, день.

Дана лабораторна робота містить у собі:

· підготовку програми для моделювання куба;

· створення вимірів куба;

· створення основної моделі куба.

 

Необхідно виконати наступні дії.

1. Підключення до джерела даних.

2. Вибір таблиці фактів і мер для куба.

3. Створення вимірів.

4. Завантаження даних.

 

Для роботи з icCube потрібно завантажити інсталяційний пакет з сайту http://www.iccube.com та встановити програму.

Для подальшої роботи необхідно запустити icCube Server через головне меню та клієнтську программу (через головне меню або вказавши адресу http://localhost:8282/icCube/icCube.html в браузері). У вікні для вводу імені та паролю (рис. 1) залишити поля пустими та нажати кнопку Login.

Рис.1.

Відкриється основне вікно для роботи з кубами (рис.2).

Рис.2.

 

Перейти на вкладку Builder. Натиснути кнопку Create scheme (рис. 3).

Рис.3.

У відповідних полях вказати ім’я схеми та ім’я групи, до якої буди віднесено схему. За замовчуванням схема включається до групи Default Group. Далі необхідно натиснути кнопку Save (рис. 4).

Рис.4.

Наступним кроком є створення джерела даних за допомогою відповідної кнопки в меню Data Integration/Data Sources (рис. 5).

Рис.5.

У наступному вікні потрібно вибрати пункт Relation Data Base и натисніть кнопку Next. Далі заповнити поля, як показано на рис.6 (ім’я джерела даних може бути будь-яким, путь до бази даних відповідає розташування файлу з даними на вашому комп’ютері).

Рис.6.

Можна перевірити правильність виконаних дій, натиснувши кнопку Test Connection.

Рис.7.

 

Далі необхідно додати всі існуючи таблиці БД до джерела даних за допомогою кнопки Add Tables (рис. 8).

Рис. 8.

 

Наступним кроком є створення вимірів. Наприклад, вимір Time з ієрархію Рік-Місяць-Дата можна створити у послідовності, показаної на рис.9-13. Кожний новий рівень створюється за допомогою відповідної кнопки + Levels.

 

 

Рис.9.

Рис.10.

 

Рис.11.

 

Рис.12.

 

Рис.13.

Вимір Region створюється аналогічно (рис. 14).

 

 

Рис.14.

 

Далі потрібно створити куб з ім’ям myCube за допомогою кнопки + Cubes та таблицю фактів sales в цьому кубі за допомогою кнопки + myCube (рис. 15).

 

.

Рис.15.

 

До кубу потрібно також додати показники storecost, storesales, unitsales (рис.16).

Рис.16.

 

Далі потрібно завантажити дані в куб за допомогою кнопки Deploy Scheme (рис. 17). У наступному вікні вибрати Deploy & Load (Re-deploy & Re-load).

Рис.17.

 

Завдання

Створити OLAP куб, як описано вище в ході роботи.

Додати вимір з такою ієрархією, яка дозволить переглянути вказані дані.

Номер варіанта дорівнює (N mod 10)+1, де N - номер студента за списком групи.

 

Варіант 1

Вимір ProductClass: =>Candy=>Chocolate candy (категорія та підкатегорія)

 

Варіант 2

Вимір ProductClass: =>Drink=>Milk (сімейство та підкатегорія)

 

Варіант 3

Вимір Customer: =>Bachelors Degree=>F (освіта та стать)

 

Варіант 4

Вимір Customer: =>Lemon Grove=>F (місто та стать)

 

 

Варіант 5

Вимір Store: =>Mexico=>Deluxe Supermarket (країна та тип місця продажу)

 

Варіант 6

Вимір Store: => CA=> Supermarket (штат та тип місця продажу)

 

Варіант 7

Вимір Promotion: => In-Store Coupon => 2014-12-31 (тип медіа та дата початку)

 

Варіант 8

Вимір Product:      =>Food=> Fruit (сімейство та категорія)

 

Варіант 9

Вимір Region:      => South West=> San Diego (регіон та місто)

 

Варіиант 10

Вимір Customer: => Albany => Bronze (місто та членська карта)

Зміст протоколу:

1. Ціль роботи

2. Завдання

3. Скріншоти створення вимірів.

4. Висновок

Контрольні питання:

1. Що таке багатомірна організація даних?

2. Що таке вимір в OLAP кубі?

3. Що таке показник в OLAP кубі?

4. Суть операцій агрегації й деталізації

5. У чому складається операція формування зрізу?

 

Лабораторна робота №3
Аналіз даних з використання багатомірного кубу.

Мета роботи:закріпити знання з проектування реляційної БД.


Теоретичні основи

Куб OLAP – це структура, у якій зберігаються сукупності даних, отримані з бази даних OLAP шляхом всіх можливих сполучень вимірів з фактами.

Багатомірний простір даних може мати будь-яку кількість вимірів. Такий простір дискретний й містить дискретну кількість значень на кожному вимірі. Розмірність простору математично визначається перемножуванням розмірів всіх вимірів. Оскільки кожний вимір дискретний, той простір є обмеженим (кінцевим).

Виміри представлені осями куба, по яких відкладають значення, що відносяться до аналізованої предметної області, наприклад, назви товарів і назви місяців року. Такі значення, що «відкладаються» уздовж вимірів, називаються Членами або Мітками (members).

 

Рис.18.

Кожний факт є сукупність однієї або декількох мер. Наприклад, окремий факт виготовлення містить у собі сукупність як мінімум трьох величин – вартість заготівки, вартість виготовлення й різні нарахування.

Найбільше часто зустрічаються наступні 4 типи фактів:

1) факти, пов'язані із транзакціями (Transaction facts). Вони засновані на окремих подіях (типовими прикладами яких є телефонний дзвінок або зняття грошей з рахунку за допомогою банкомату);

2) факти, пов'язані з «моментальними знімками» (Snapshot facts). Засновані на стані об'єкта (наприклад, банківського рахунку) у певні моменти часу, наприклад на кінець дня або місяця. Типовими прикладами таких фактів є обсяг продажів за день або денний виторг;

3) факти, пов'язані з елементами документа (Line-item facts). Засновані на тім або іншому документі (наприклад, рахунку за товар або послуги) і містять докладну інформацію про елементи цього документа (наприклад, кількість, ціну, відсоток знижки);

4) факти, пов'язані з подіями або станом об'єкта (Event or state facts). Представляють виникнення події без подробиць про нього (наприклад, просто факт продажу або факт відсутності такого без інших подробиць).

Таблиця фактів є основною таблицею сховища даних. Вона, як правило, містить унікальний складений ключ, що поєднує первинні ключі таблиць вимірів. Найчастіше це цілочислені значення або значення типу «дата/час» – адже таблиця фактів може містити сотні тисяч або навіть мільйони записів, і зберігати в ній повторювані текстові описи, як правило, невигідно – краще помістити їх у менші по обсягу таблиці вимірів. При цьому як ключові, так і деякі неключові поля повинні відповідати майбутнім вимірам OLAP-Куба. Крім цього таблиця фактів містить одне або кілька числових полів, на підставі яких надалі будуть отримані агрегатні дані.

Як правило, у фактах немає надмірності, вона є тільки у вимірах.

 

Завдання

У даній лабораторній роботі необхідно виконати проектування й створення OLAP-куба, що відповідає завданню, використовуючи як інструментарій icCube.

OLAP-куб створюється на основі вже існуючої БД NWind (mysql).

Необхідно ознайомитися зі структурою цієї БД - з таблицями, полями, зв'язками між ними. Все це знадобиться для грамотного проектування OLAP-куба.

У даній лабораторній роботі потрібно побудувати OLAP-куб, за допомогою якого можна провести аналіз даних із БД, що відповідає варіанту завдання.

Необхідні для аналізу виміри, міри й ієрархії куба вибираються по варіанту завдання. У дужках зазначені обов'язкові рівні ієрархії, які повинні бути присутнім у вимірах. При необхідності створити таблиці, які поєднують дані таким чином, щоб схема даних відтворювала схему «зірка».

Номер варіанта дорівнює (N mod 10) +1, де N - номер студента за списком групи.

 

Варіант 1

Аналіз цін і кількості замовлень щодо дати призначення, товару (Марка, Тип), співробітника (Прізвище, Місто, Країна).

Варіант 2

Аналіз цін і кількості замовлень щодо дати виконання, співробітника (Прізвище, Місто, Країна), клієнта (Назва, Місто, Країна).

 

Варіант 3

Аналіз цін і кількості замовлень щодо дати розміщення, товару (Марка, Тип), клієнта (Назва, Місто, Область, Країна).

 

Варіант 4

Аналіз цін і кількості замовлень щодо дати призначення, товару (Марка, Тип), постачальника (Назва, Місто, Країна).

Варіант 5

Аналіз цін і кількості замовлень щодо дати призначення, співробітника (Прізвище, Місто, Область), постачальника (Назва, Місто, Країна).

 

Варіант 6

Аналіз цін і кількості замовлень щодо дати виконання, клієнта (Назва, Місто, Країна), постачальника (Назва, Місто, Область).

 

Варіант 7

Аналіз цін і кількості замовлень щодо дати призначення, клієнта (Назва, Місто, Область), постачальника (Назва, Місто, Країна), товару (Марка, Тип).

 

Варіант 8

Аналіз цін і кількості замовлень щодо дати виконання, клієнта (Назва, Місто, Країна), співробітника (Прізвище, Місто, Країна), товару (Марка, Тип).

 

Варіант 9

Аналіз цін і кількості замовлень щодо дати призначення, постачальника (Назва, Місто, Країна), співробітника (Прізвище, Місто, Область), товару (Марка, Тип).

 

Варіант 10

Аналіз цін і кількості замовлень щодо дати виконання, клієнта (Назва, Місто, Країна), співробітника (Прізвище, Місто, Область), постачальника (Назва, Місто, Країна).

Зміст протоколу:

1. Ціль роботи

2. Варіант завдання.

3. Опис перетворення таблиць БД.

4. Скріншоти для створення кубу. 

5. Висновок

Контрольні питання:

1. Скільки вимірів у створеному OLAP-кубі?

2. Обґрунтуйте вибір структури (виміру, мері, ієрархії) створеного OLAP-куба?

3. Які зміни у вихідну БД потрібно внести для спрощення побудови OLAP-куба на її основі?

Лабораторна робота №4
Побудова OLAP зрізів куба клієнтським засобом

Мета роботи: одержати навички у проектуванні структури OLAP-куба для проведення аналізу деяких економічних показників роботи підприємства, на основі вже існуючої реляційної БД; навчитися поєднувати дані багатомірного кубу та засобів офісних застосувань

 


Теоретичні основи

Щоб узагальнити й проаналізувати дані не з застосування Mіcrosoft Excel, наприклад, записи продажів компанії, можна одержувати дані із зовнішніх джерел, включаючи бази даних, куби OLAP і текстові файли. При витягу вхідних даних з бази даних ці дані повертаються в офісне застосування тільки як звіт зведеної таблиці або звіт зведеної таблиці, перетворений у функції аркуша.

Засоби створення зведених таблиць зберігають у кеші агрегатні дані, обчислені на основі даних з реляційних СУБД або отримані від OLAP-серверів. Маніпулюючи зведеною таблицею, користувач може управляти відображенням даних із цього кеша.

Підключення до бази даних OLAP

1. На вкладці Дані в групі Одержати зовнішні дані натисніть кнопку З інших джерел і вибрати варіант Зі служб аналітики.

На екрані буде відображене вікно майстра підключення до даних. Цей майстер має три екрани.

2. На кроці 1 увести ім'я сервера OLAP у текстове поле Ім'я сервера. Для icCube треба вказати таке ім’я http://localhost:8282/icCube/xmla. Щоб указати ім'я файлу автономного куба (файл із розширенням CUB, створений на локальному жорсткому диску або мережному ресурсі, у якому зберігаються вхідні дані, файли автономного куба дозволяють продовжувати роботу при відсутності підключення до сервера OLAP), необхідно ввести повний шлях до файлу, ім'я й розширення файлу. У розділі Облікові відомості необхідно або вибрати пункт Використати перевірку дійсності Wіndows для використання поточного імені користувача Wіndows і пароля або вибрати варіант Використати наступне ім'я користувача й пароль для уведення імені користувача й пароля до бази даних й увести відповідні дані в поля Ім'я користувача й Пароль.

3. На кроці 2 у розділі Виберіть базу даних, що містить потрібні відомості, вибрати створену для куба схему.

4. Для підключення до певного куба усередині бази даних установити прапорець Підключитися до певного куба або таблиці, а потім вибрати куб зі списку. Нажати кнопку кнопку Готово, щоб закрити вікно майстра підключення до даних.

5. Відкриється діалогове вікно Імпорт даних.

6. У розділі Виберіть спосіб подання даних у книзі вибрати Звіт зведеної таблиці для створення тільки звіту зведеної таблиці або вибрати Зведена діаграма й звіт зведеної таблиці для створення звіту зведеної таблиці й зведеної діаграми.

7. Сформувати необхідну структуру зведеної таблиці.

 

Звіт зведеної таблиці використається для підсумовування, аналізу, дослідження й подання зведених даних. Звіт зведеної діаграми - для візуалізації даних у звіті зведеної таблиці й спрощення процедури порівнянь, пошуку закономірностей і тенденцій. Звіти зведеної таблиці й зведеної діаграми дозволяють приймати рішення, засновані на отриманій інформації про важливі дані в організації.

 

Завдання

За допомогою механізму зведених таблиць переглянути дані, отримані у лабораторній роботі №3.

                                                                                                       

Зміст протоколу:

1. Ціль роботи

2. Варіант завдання.

3. Скріншот зведеної таблиці.

4. Висновок

 

Контрольні питання:

1. Які засоби відображення агрегованих даних в офісних застосуваннях ви знаєте?

2. Як застосувати куб у якості джерела даних в офісних застосуваннях?

 

Лабораторна робота №5
Підготовка реляційної БД як джерела даних для сховища даних

Мета роботи:закріпити знання з проектування реляційної БД.


Теоретичні основи

Збір і зберігання інформації, а також рішення завдань інформаційно-пошукового запиту ефективно реалізуються засобами систем керування базами даних (СУБД). В OLTP (Onlіne Transactіon Processіng)-підсистемах реалізується транзакційна обробка даних. Безпосередньо OLTP-системи не підходять для повноцінного аналізу інформації в силу суперечливості вимог, пропонованих до OLTP-систем і СППР.

Одержання аналітичної звітності в інформаційних системах, заснованих на традиційних базах даних зв’язано з рядом обмежень:

- розробка кожного звіту вимагає роботи програміста;

- звіти формуються дуже повільно, сповільнюючи при цьому роботу всієї інформаційної системи;

- дані, одержувані від різних структурних елементів компанії не уніфіковані й часто суперечливі.

Сховища даних призначені для обробки щодо невеликої кількості транзакцій, які мають непередбачений характер і вимагають відповіді на довільні, неструктуровані й евристичні запити. Інформація в сховище даних організована відповідно до вимог можливих запитів і призначена для підтримки прийняття довгострокових стратегічних рішень відносно невеликою кількістю керівників

Хоча системи OLTP і сховища даних мають зовсім різні характеристики й створюються для різних цілей, вони тісно зв'язані в тому розумінні, що системи OLTP є джерелом інформації для сховища даних.

Порівняння основних характеристик типових систем OLTP і сховищ даних

Система OLTP Сховище даних
Містить поточні дані Містить історичні дані
Містить поточні дані Зберігає докладні відомості, а також частково й повністю узагальнені дані
Дані є динамічними Дані в основному є статичними
Повторюваний спосіб обробки даних Нерегламентований, неструктурований й евристичний спосіб обробки даних
Висока інтенсивність обробки транзакцій Середня й низька інтенсивність обробки транзакцій
Передбачуваний спосіб використання даних Непередбачений спосіб використання даних
Призначена для обробки транзакцій Призначено для проведення аналізу
Орієнтована на прикладні області Орієнтовано на предметні області
Підтримка прийняття повсякденних рішень Підтримка прийняття стратегічних рішень
Обслуговує велика кількість працівників виконавчого рівня Обслуговує відносно мала кількість працівників керівного рівня

 

Завдання

1. Розробити структуру реляційної БД для заданої предметної області. Предметна область вибирається відповідно до варіанта, номер варіанта відповідає номеру студента за списком.

2. Заповнити БД даними.

Номер варіанту співпадає з номер за списком.

 

Варіанти

Варіант 1

Предметна область "Облік устаткування на підприємстві". Можливі види діяльності: облік закупівель устаткування із вказівкою характеристик, установка встаткування на робоче місце (можливе переміщення зі збереженням історії переміщення); закріплення за матеріально відповідальним співробітником; переоцінка; ремонт.

 

Варіант 2

Предметна область "Фермерське господарство". Можливі види діяльності: облік посаджених культур; реалізація врожаю; закупівля добрив і розрахунок з постачальниками; облік проведених робіт, використовуваної техніки.

 

Варіант 3

Предметна область "Хімчистка". Можливі види діяльності: прийом у клієнтів замовлень на виконання робіт над речами; облік роботи співробітників; закупівля й витрата реактивів; оплата праці співробітників.

 

Варіант 4

Предметна область "Спортивна програма". Можливі види діяльності: облік програм з підготовлених співробітниками сюжетів; вихід програм в ефір; гості програми; ведення довідників про змагання і їхніх учасників (результати, досягнення, біографія, цікаві факти).

 

Варіант 5

Предметна область "Історичний довідник". Можливі види діяльності: ведення інформації про існуючим й існуючим у цей час державах, їхніх столицях; одержання інформації про правителів й їхні правління, про війни, битви, історичні події, історичних особистостях.

 

 

Варіант 6

Предметна область "Біржа праці". Можливі види діяльності: постановка на облік безробітних з описом їхнього послужного списку; виплата посібників; перенавчання; облік наявних по спеціальностях роботодавців і вакансій; облік зроблених пропозицій про роботу.

 

Варіант 7

Предметна область "Тестування". Можливі види діяльності: ведення бази питань, розподілених по предметах, темам і рівням, і відповідей (можливих і правильних) із вказівкою авторів питань; облік виконаного тестування для кожного того, якого навчають, з інформацією про отримані їм питаннях, даних відповідях і загальних результатах; формування тестів з наявних питань.

 

Варіант 8

Предметна область "Реклама в комерційному виданні". Можливі види діяльності: облік прийнятих для реклами замовлень із вказівкою співробітника, що оформив замовлення; облік характеристик реклами із замовлення й додаткових умов; облік публікацій, що вийшли, і поетапної оплати замовлень; облік оплати співробітникам бонусу за принесені замовлення.

 

Варіант 9

Предметна область "Телефонна компанія". Можливі види діяльності: облік абонентів з можливими пільгами; облік зроблених ними дзвінків по різних напрямках; розрахунок вартості дзвінка з урахуванням напрямку, дати й часу доби й тривалості; оплата абонентами послуг.

Варіант 10

Предметна область "Приймальна комісія ВУЗА". Можливі види діяльності: прийом заяв від абітурієнтів з обліком отриманих при зовнішнім тестуванні оцінок, пільг; облік прийнятих документів; ведення бази даних наявних спеціальностей на різних факультетах і по різних формах навчання.

Варіант 11

Предметна область "Концертний зал". Можливі види діяльності: проведення виступів у рамках гастролей різних виконавців; реклама концертів; облік продажів квитків з урахуванням розцінок по категоріях місць; розрахунок з виступаючими й з тими, хто забезпечує проведення концерту.

 

Варіант 12

Предметна область "Банкетний зал". Можливі види діяльності: прайс-лист можливих блюд по категоріях; прийом замовлень на проведення банкетів з описом замовлених блюд; ведення довідника витрати продуктів для блюд; закупівля продуктів; можливо, поетапна оплата замовлень; облік участі співробітників у забезпеченні банкета.

Варіант 13

Предметна область "Ремонтно-будівельна бригада". Можливі види діяльності: облік прийнятих замовлень на виконання різних робіт на об'єкті; облік виконаних робітниками робіт, оплата праці робітників; закупівля матеріалів, розрахунок з постачальниками.

Варіант 14

Предметна область "Служба таксі". Можливі види діяльності: облік роботи водіїв на різних машинах по змінах; облік зданого виторгу; ведення довідника за вартістю проїзду в різних напрямках; оплата водієм за використання рації; облік прийнятих і виконаних замовлень.

Варіант 15

Предметна область "Аварійна служба". Можливі види діяльності: облік робочих змін працівників побригадно; облік заявок на проведення робіт; облік витрачених матеріалів при ліквідації аварій; оплата праці з розрахунком преміальних залежно від тривалості й складності виконаних робіт.

Варіант 16

Предметна область "Облік програмного забезпечення на комп'ютерах організації". Можливі види діяльності: облік комп'ютерів і додаткового встаткування з описом їхніх характеристик на робочих місцях по приміщеннях; облік установлених програмних продуктів, їхніх версій і наявності ліцензії; ведення паролів на право використання різних продуктів користувачами різних категорій.

Варіант 17

Предметна область "Податкова інспекція". Можливі види діяльності: облік організацій, що займаються різними видами діяльності; облік наявності актуальної ліцензії (зберігання історії надання ліцензій); призначення інспектора для організації; облік необхідної звітності з описом періодичності; облік зданої документації; облік оплати різних податків.

 

Варіант 18

Предметна область "Пасажирські залізничні перевезення". Можливі види діяльності: ведення розкладу поїздів із вказівкою всіх проміжних станцій; облік фактичних відправлень і прибуттів, облік роботи співробітників на конкретних рейсах; облік проданих квитків по різних типах вагонів.

Варіант 19

Предметна область "Судочинство". Можливі види діяльності: облік прийнятих до розгляду справ з описом статей, обставин, проведених засідань й їхніх учасників; облік запитів, зроблених по кожній справі, і документів, залучених до справи.

Варіант 20

Предметна область "Митниця". Можливі види діяльності: облік минаючих через границю вантажів з описом вхідних у них товарів, прикладених документів і вказівкою власника; ведення довідника розмірів мит по категоріях й обсягу товарів; облік внесеної оплати мита.

 

Варіант 21

Предметна область "Будинок дитячої творчості". Можливі види діяльності: облік роботи секцій із вказівкою керівників й учасників; ведення розкладу з урахуванням приміщень; облік фактичних занять; опис заходів за участю секцій; облік оплати занять учасниками секцій.

 

Варіант 22

Предметна область "Курси іноземних мов". Можливі види діяльності: облік роботи груп із вказівкою викладачів і студентів й описом мови й рівня; ведення розкладу; облік фактичних занять; облік оплати занять студентами.

 

Варіант 23

Предметна область "Ведення статистики захворюваності". Можливі види діяльності: облік зареєстрованих захворювань по регіонах, медустановах, ділянкам, лікарям, категоріям захворювань, пацієнтам і категоріям пацієнтів.

 

Варіант 24

Предметна область "Зелентрест". Можливі види діяльності: облік проведених робіт з різних об'єктів із вказівкою використаного інструмента; облік вирощених, реалізованих і висаджених на об'єктах рослин; облік закупівлі допоміжних матеріалів й їхньої витрати при проведенні робіт.

 

Варіант 25

Предметна область "Дорожня служба". Можливі види діяльності: облік проведених робіт працівниками побригадно на різних об'єктах із вказівкою витрачених матеріалів, використаного інструмента й транспорту; облік оплати праці працівникам.

 

Варіант 26

Предметна область "Школа". Можливі види діяльності: облік учнів по класах; облік роботи вчителів по різних предметах і по кабінетах; облік проведених у школі заходів; ведення розкладу; облік атестаційних категорій учителів, одержуваних поетапно.

Варіант 27

Предметна область "Швидка допомога". Можливі види діяльності: облік роботи співробітників по бригадах, по змінами й по машинах; облік прийнятих викликів, пацієнтів, використаних ліків і встановлених діагнозів.

 

Варіант 28

Предметна область "Електрослужба". Можливі види діяльності: облік ув'язнених з абонентами договорів; облік витраченої абонентами енергії; формування вартості витраченої енергії по різних тарифах; облік ліквідації аварій на підлеглих об'єктах; оплата використаної електроенергії.

 

Варіант 29

Предметна область "Футбольна ліга". Можливі види діяльності: облік проведених командою ігор у різних змаганнях; облік результатів й опис голів (хто й коли забив); облік тренерської роботи різних тренерів, переходів спортсменів; облік участі спортсменів у зборах; облік отриманих травм.

 

Варіант 30

Предметна область "Автомайстерня". Можливі види діяльності: облік виконаних робіт з ремонту машин, їхніх окремих механізмів з розподілом робіт між працівниками; облік внесеної оплати роботи власником; ведення прайс-листа ремонтних робіт; облік інструмента.

Зміст протоколу:

1. Ціль роботи

2. Варіант завдання

3. Схема зв’язків між таблицями БД.

4. Скрипт створення таблиць БД з операторами на SQL.

5. Висновок

 

Контрольні питання:

1. Що таке концептуальна модель даних?

2. Які види взаємозв’язків існують між об’єктами?

3. Назвіть особливості реляційної моделі даних.

4. Чим відрізняється OLTP-система від OLAP-системи?

Лабораторна робота №6
Створення сховища даних на основі реляційної БД за заповнення його даними

Мета роботи:закріпити знання з створення структури сховища даних,використовуючи реляційну БД у якості джерела даних.


Теоретичні основи

 

Багато питань, пов'язаних із ХД, у першу чергу стосуються завдань одержання й підготовки даних. Ці дані треба витягти з різних джерел, очистити, перетворити й консолідувати, після чого завантажити в базу даних підтримки прийняття рішень (ППР). Згодом завантажені дані повинні періодично обновлятися.

1) Витяг даних -це процес вибірки даних з оперативних баз даних й інших джерел. Для витягу даних існує множина інструментів, включаючи утиліти, надавані системою, користувальницькі програми витягу й комерційні продукти витягу даних (загального призначення). У процесі витягу звичайно інтенсивно використовуються операції вводу-виводу, що може послужити перешкодою для виконання інших операцій, важливих з погляду діяльності підприємства. Тому витяг даних часто здійснюється в паралельному режимі (тобто як множина паралельно виконуваних підпроцесів) і на фізичному рівні.

Але такі "фізичні операції витягу" можуть викликати проблеми при наступній обробці, оскільки вони можуть супроводжуватися втратою інформації (особливо даних про зв'язки), що представляється яким-небудь фізичним способом, наприклад, за допомогою покажчиків або фізично суміжного розміщення. Із цієї причини програми витягу іноді надають засоби захисту такої інформації за допомогою полів послідовних номерів записів і заміни покажчиків значеннями зовнішнього ключа.

Очищення даних

Не всі джерела даних забезпечують задовільний контроль інформації. Тому перш ніж дані будуть уведені в БД ППР, звичайно потрібно виконати їхнє очищення. Звичайно очищення передбачає заповнення відсутніх значень, коректування помилок й інших помилок, допущених при уведенні даних, визначення стандартних скорочень і форматів, заміну синонімів стандартними ідентифікаторами й т.д. Дані, які визначаються як помилкові й не можуть бути виправлені, відкидаються.

Інформація, отримана при виконанні очищення даних, іноді використається для виявлення причин помилок у джерелах даних і тому підвищує якість інформації, що міститься в них.










Последнее изменение этой страницы: 2018-05-10; просмотров: 246.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...