Студопедия КАТЕГОРИИ: АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Модель ассоциативных правил
Рассмотрим некоторое множество . Уровнем поддержки (support level) множества X на базе транзакций D понимается величина Supp(X), равная доле транзакций, содержащих все элементы из этого множества: , где |Z| означает мощность множества Z, N=|D|. Для определения часто встречающихся наборов данных (frequent itemset) задается минимальный уровень поддержки minsupp. Набор данных X называется часто встречающимся в базе транзакций D , если Supp(X)>minsupp. Ассоциативным правилом называется импликация X=>Y, где , и . Из такого правила мы устанавливаем закономерность следующего вида: "Если в транзакции встретился набор элементов X, то можно сделать вывод, что в этой же транзакции должен появиться набор элементов Y". Установление таких закономерностей дает нам возможность находить правила, называемые ассоциативными. Пусть нам дана база транзакций D и известно, в какие группы (таксоны) входят элементы. Тогда можно извлекать из данных правила, связывающие группы с группами, отдельные элементы с группами и т.д. Обобщенным ассоциативным правилом называется импликация X=>Y, где , и и где ни один из элементов, входящих в набор Y, не является предком ни одного элемента, входящего в X. Рассмотрим далее наиболее важные характеристики ассоциативных правил. Поддержка правила X=>Y представляет собой количество транзакций, содержащих совместно X и Y: S(X=>Y)=S( ). Аналогично определяется уровень поддержки и минимальный уровень поддержки ассоциативного правила. Уровень поддержки правила X=>Y определяет вероятность совместного появления наборов X и Y: Supp(X=>Y)=Supp( )= , где P(A) – вероятность события A, P(A,B) – совместная вероятность событий A и B. Достоверность правила показывает какова вероятность того, что из X следует Y. Правило X=>Y справедливо с достоверностью (confidence) c, если c% транзакций из D, содержащих X, также содержат Y, Сonf(X=>Y) = Supp( )/Supp(X ) =P( | ), где P(A|B) – условная вероятность выполнения события A при условии выполнения события B. Для поиска ассоциативных правил задается минимальный уровень достоверности minconf. Если он будет слишком большим, то в результате будут найдены только очевидные правила, если слишком низким, то будет найдено слишком много правил, которые не соответствуют реальным взаимосвязям элементов, а получились в результате случайной комбинации элементов в наборе. Кроме уровня поддержки и достоверности интерес вызывают следующие характеристики: а) корреляция (correlation) показывает наличие статистической взаимосвязи появления наборов X и Y: ; б) интересность (улучшение, lift = interest) показывает, полезнее ли правило случайного угадывания: если интересность больше единицы, то это значит, что с помощью правила предсказать наличие набора Y вероятнее, чем случайное угадывание, если меньше единицы, то наоборот: ; в) убежденность(conviction) можно интерпретировать как отношение вероятности случайного угадывания к вероятности отсутствии набора Y приналичии набора X, если убежденность больше 1, тоэто значит, что с помощью правила предсказать отсутствие набора Y вероятнее, чем случайное угадывание; г) полная уверенность(all-confidence) определяет отношение поддержки набора к максимуму поддержки его элементов: All-confidence(A)= ; д) плечо (leverage) показывает, насколько больше доля наборов при совместном появлении, чем при условии случайного выбора элементов: .
|
||
Последнее изменение этой страницы: 2018-04-12; просмотров: 285. stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда... |