![]() Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Модель ассоциативных правил
Рассмотрим некоторое множество
где |Z| означает мощность множества Z, N=|D|. Для определения часто встречающихся наборов данных (frequent itemset) задается минимальный уровень поддержки minsupp. Набор данных X называется часто встречающимся в базе транзакций D , если Supp(X)>minsupp. Ассоциативным правилом называется импликация X=>Y, где Пусть нам дана база транзакций D и известно, в какие группы (таксоны) входят элементы. Тогда можно извлекать из данных правила, связывающие группы с группами, отдельные элементы с группами и т.д. Обобщенным ассоциативным правилом называется импликация X=>Y, где Рассмотрим далее наиболее важные характеристики ассоциативных правил. Поддержка правила X=>Y представляет собой количество транзакций, содержащих совместно X и Y: S(X=>Y)=S( Аналогично определяется уровень поддержки и минимальный уровень поддержки ассоциативного правила. Уровень поддержки правила X=>Y определяет вероятность совместного появления наборов X и Y: Supp(X=>Y)=Supp( где P(A) – вероятность события A, P(A,B) – совместная вероятность событий A и B. Достоверность правила показывает какова вероятность того, что из X следует Y. Правило X=>Y справедливо с достоверностью (confidence) c, если c% транзакций из D, содержащих X, также содержат Y, Сonf(X=>Y) = Supp( где P(A|B) – условная вероятность выполнения события A при условии выполнения события B. Для поиска ассоциативных правил задается минимальный уровень достоверности minconf. Если он будет слишком большим, то в результате будут найдены только очевидные правила, если слишком низким, то будет найдено слишком много правил, которые не соответствуют реальным взаимосвязям элементов, а получились в результате случайной комбинации элементов в наборе. Кроме уровня поддержки и достоверности интерес вызывают следующие характеристики: а) корреляция (correlation) показывает наличие статистической взаимосвязи появления наборов X и Y:
б) интересность (улучшение, lift = interest) показывает, полезнее ли правило случайного угадывания: если интересность больше единицы, то это значит, что с помощью правила предсказать наличие набора Y вероятнее, чем случайное угадывание, если меньше единицы, то наоборот:
в) убежденность(conviction) можно интерпретировать как отношение вероятности случайного угадывания к вероятности отсутствии набора Y приналичии набора X, если убежденность больше 1, тоэто значит, что с помощью правила предсказать отсутствие набора Y вероятнее, чем случайное угадывание; г) полная уверенность(all-confidence) определяет отношение поддержки набора к максимуму поддержки его элементов: All-confidence(A)= д) плечо (leverage) показывает, насколько больше доля наборов при совместном появлении, чем при условии случайного выбора элементов:
|
||
Последнее изменение этой страницы: 2018-04-12; просмотров: 346. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |