Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Типи використовуваних даних




У системах аналізу багатомірних даних можна виділити три основних типи даних, аналіз яких дозволяє робити прогнозування бізнес процесів.

Агреговані дані

Користувача, що займається аналізом, рідко цікавлять деталізовані дані. Більш того, чим вище рівень користувача (керівника, керуючого, аналітика), тим вище рівень агрегації даних, використовуваних їм для ухвалення рішення.

Приклад.Є фірма із продажу комп'ютерів. Комерційного директора такої фірми мало цікавить питання: «Якого кольору комп'ютери краще всього продає менеджер Петров: чорного або сріблистого?» Для нього важливо, які моделі, і які кольори воліють у даному регіоні. Його також мало цікавить деталізація на рівні контракту, часу або навіть дня. Для правильного формування складу йому важлива й необхідна інформація на рівні декади, місяця або навіть кварталу.

Історичні дані

Після того як зафіксовано, що Петров у червні поточного року продав 2 комп'ютери Celeron і 12 комп'ютерів Pentium, дані про цю подію стають історичним (таким, що здійснився) фактом. І після того, як інформація про цей факт отримана, верифікована й заведена в БД, вона може бути багаторазово зчитана звідти, але вже не може й не повинна бути змінена.

Історичність даних припускає не тільки високий рівень статичності (незмінності) як властиво даних (наприклад: Петров продав цього року 51 комп'ютер Pentium), так і їхніх взаємозв'язків (наприклад: цього року Петров працював у м.Суми; цього року продавалися комп'ютери моделі Pentium). Це дає можливість використовувати спеціалізовані, засновані на припущенні про статичність даних і їхніх взаємозв'язків методи завантаження, зберігання, індексації й вибірки.

Прогнозовані дані

Коли говориться про незмінність і статичність даних в аналітичних системах, мається на увазі незмінність винятково історичних даних (даних, що описує події вже, які відбулися). Таке припущення не поширюється на прогнозовані дані (дані про подію, що ще не відбувалася).

Наприклад, якщо будується прогноз про обсяг продажів на наступні роки для менеджера Петрова, то в міру надходження фактичних (історичних) даних за поточний рік ця цифра буде багаторазово змінюватися й уточнюватися. Більш того, досить часте прогнозування й моделювання зачіпає не тільки майбутні, що ще не відбулися, але й минулі, що вже здійснилися події. Наприклад, аналіз: «а, що буде (було б)... якщо (би)..?», будується на припущенні про те, що значення деяких даних, у тому числі й з минулого, відмінні від реальних. І для відповіді на питання: «Який був би прогноз по обсягу продажів комп'ютерів Athlonдля менеджера Петрова на наступний рік, якби обсяг продажів комп'ютерів Celeron цього року в нього зріс на той же відсоток, що обсяг продажів Pentium»,буде потрібно не тільки обчислити нове, ще не існуюче значення обсягу продажів для року, що ще не наступив, але й попередньо обчислити гіпотетичне значення обсягу продажів за вже минулий період.

 

В 1995 році на основі вимог, викладених Коддом, сформульований тест FASMI (Fast Analysis of Shared Multidimensional Information), що переводиться як «швидкий аналіз поділюваної багатомірної інформації». Тест FASMI включає наступні вимоги до застосувань для багатомірного аналізу:

• надання користувачеві результатів аналізу за прийнятний час (приблизно 5 с) при припустимому рівні деталізації аналізу (прості за 2 с, невелика кількість дуже складних не більш ніж за 20 с);

• можливість здійснення будь-якого логічного й статистичного аналізу, підтримуваного використовуваним додатком, зі збереженням результатів у доступному для користувача виді;

• багатокористувальницький доступ до даних з підтримкою відповідних механізмів блокування й засобів автоматизованого доступу;

• багатомірне концептуальне представлення даних, включаючи повну підтримку для ієрархій і множинних ієрархій вимірів (ключова вимога OLAP);

• можливість звертатися до будь-якої потрібної інформації незалежно від її обсягу й місця зберігання.

У статті Е.Ф.Кодда, у якій уперше було дано формальне визначення OLAP-технології, також були описані дванадцять правил,які описуютьголовні особливості OLAP, до цих правил в 1995 році були додані ще кілька.










Последнее изменение этой страницы: 2018-05-10; просмотров: 223.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...