Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Визуальное представление продукционных правил с помощью И/ИЛИ графов.




 

Недостатком множества продукционных правил является то, что сложно получить полную картину описания предметной области, наблюдая только правила типа: Если – то.

Поэтому для более наглядного визуального представления используют древовидные графы, которые позволяют визуально представить описание предметной области.

Полезной особенностью продукционных систем является то, что они допускают разнообразные формы представления продукционных правил:

1. a->B - импликация, из а следует В

2. Продукционные правила могут быть представлены в виде графа.

Вопрос №5

Модель семантической сети

 

В этих моделях вся предметная область описывается как граф, но для того чтобы граф можно было считать семантической сетью необходимо, чтобы его вершины обозначали сущности предметной области, а дуги связи между этими сущностями.

В зависимости от типов связи семантические сети можно разделить на разные типы, например: по типу отношений их делят на однородные и неоднородные. В однородных сетях используется единственный тип отношений, в неоднородных различные типы отношений.

По типам связей их также классифицируют на классифицирующие сети, функциональные сети и сценарии.

· В классифицирующих сетях используется отношение структуризации, т.е. можно ввести отношение иерархии между сущностями.

· В функциональных сетях связи между сущностями представляют собой функциональные отношения, их часто называют вычислительными моделями.

· В сценариях описываются определенные последовательности действий, которые связанны зачастую одновременно и функциональными и классификационными связями.

 

Хотя принципы построения каждой семантической сети свои собственные тем не менее существуют некоторые общие принципы которые используются при построении любых сетей. Рассмотрим некоторые из них.

 

Концепция одновременного рассмотрения как знака так и типа.

Знак – конкретное значение какого либо объекта.

Тип – класс подобных знаков

       Т.е. в одной и той же семантической сети обычно присутствуют как знаки так и типы.

Концепция иерархий типов

Эта концепция позволяет установить иерархию абстракции для различных объектов. Для построения такой иерархии используют операции абстрагирования.

1. Идентификация

Т.е. установление конкретного значения некоторого объекта.

2. Агрегация

Она позволяет рассматривать связь между объектами как новый объект

3. Обобщение

Позволяет объединить множество знаков или типов в один новый тип. Обобщение делится на классификацию (обобщение, знак-тип) и собственно обобщение (на уровне тип – тип)

Операции агрегации и обобщения могут взаимно пересекаться в приделах одной и той же семантической сети. Т.е. мы можем построить обобщение агрегатов, а можем выполнить агрегацию обобщений.

Принято считать, что операции агрегации связаны с таким понятием как «Есть - часть», т.е. операция агрегации задает такое отношение.

Операция обобщения связывается с понятием «Есть - некоторое»

Другими словами операции агрегации акцентируют внимание на структуре объекта, а операции обобщения выделяют общие свойства объектов, не обращая внимания на их различия.

Особый момент в семантических сетях представляет собой процедура вывода. Дело в том, что семантическая сеть это интегрированное представление. Когда совместно представлены, и структура данных, и процедура вывода.

Существуют разные способы построения выводов в семантических сетях, идея одного из них самого распространенного заключается в следующем: Пусть некоторая семантическая сеть построена по определенным правилам. Необходимо реализовать запрос к этой сети. Процедура реализации запроса будет выглядеть так: По тем же правилам, по которым была построена семантическая сеть, строится сеть, соответствующая запросу, по сути, полученный граф будет представлять собой подграф исходного графа сети. После чего выполняется наложение графа запроса на основной граф. В результате при сопоставлении вершин и дуг, можно найти неизвестное значение в запросе.

Разобьем все вершины, которые будут соответствовать сущностям предметной области на несколько групп.

1. Концепты – представляют собой некоторые конкретные объекты, для которых строится описание.

2. События – процессы, которые происходят в данной предметной области

3. Характеристики - описывают свойства концептов

4. Значения - они соответствуют тем величинам, которые могут принимать характеристики в качестве значений.

Вопрос №6

Представление и использование не четких и ненадежных знаний

 

Некорректно поставленные задачи существует во всех предметных областях. Более того, можно сказать, что большинство реальных задач являются нечеткими. Корректно поставленные задачи решаются с использованием традиционных методов, которые, как правило, хорошо формализованы, для них существует описанные, математические методы и алгоритмы решений. Для решения некорректных задач используется специфические методы, позволяющие учитывать и оценивать некорректность в процессе логического вывода.

Надо отметить что сам термин «Нечеткие знания» является не совсем корректным, т.к. неясно каким образом структурированы знания в мозгу человека, и как они там представлены, поэтому не существует какой-то единой и общей теории нечеткости, но существует определенные классификации ненадежных знаний. И в зависимости от вида нечеткости применяются те или иные методы.

В инженерии знаний обычно выделяют следующие виды нечеткостей:

1) Недетерминированность выводов

2) Многозначность. Проблема состоит в том, что на определенных шагах поиска решения возникает множество вариантов дальнейшего хода действий, но при этом отсутствует критерий выбора наиболее предпочтительного пути.

3) Ненадежность фактов и правил, которые используются при построении вывода.

4) Неполнота. Ситуация возникает в том случае, когда для решения задачи просто недостает исходных данных.

5) Работа с нечеткими множествами, т.е. с множествами, для которых нельзя определить четких границ.

Ненадежные знания и выводы

Во многих практических задачах приходится работать с данными, достоверность которых нельзя считать полной, т.е. 100%. Такие знания могут быть достоверными с некоторой степенью доверия. Степень доверия обычно выражают коэффициентом доверия, который представляет собой число с плавающей запятой в диапазоне 0..1 В основе большинства методов работы с ненадежными знаниями лежат так называемые Байесовские методы, т.е. это методы работы с вероятностными величинами.

Пример:

Пусть имеется черный ящик в котором лежат шары. Эти шары помечены следующим образом. Одни имеют метку А, другие Б, третьи имеют метку АБ и часть шаров вообще без меток.

Проведем следующий эксперимент: Будем доставать из ящика по одному шару и будем подсчитывать общее число извлеченных шаров и число извлеченных шаров которые имели метку А не зависимо от Б. После подсчета шары возвращаем в ящик. После проведения некоторого числа экспериментов, мы можем вычислить вероятность извлечения шара с меткой А, для этого достаточно поделить число извлеченных шаров с меткой А на общее число шаров:

P(A) = (число шаров с меткой “A”)/(Общ. Число шаров)

Вероятность, определяемая таким образом называется априорной вероятностью некоторого события. Очевидно, что аналогично можно определить и вероятность извлечения шара с меткой Б.

Рассмотрим более сложную ситуацию. Попытаемся определить вероятность происхождения некоторого события при условии выполнения другого события. Для этого проведем следующий эксперимент: Также как и в предыдущем случае будем извлекать шары и вести подсчет. Но при этом будем учитывать общее число извлеченных шаров, число шаров которые имеют метку А, независимо от Б, число шаров имеющих метку Б, независимо от А, а также число шаров имеющих метку АБ. После проведения этих экспериментов можно вычислить вероятность извлечения шара имеющего метку АБ одновременно. Это может быть описано следующим образом:

P(A и Б)=(число шаров с меткой АБ)/(Общее число шаров) (*)

Чтобы вычислить вероятность извлечения шара имеющего метку А при условии что был извлечен шар имеющий метку Б необходимо произвести следующие вычисления:

P(A|Б)=(Число шаров с меткой АБ)/(число шаров с меткой Б)        (**)

Эта вероятность называется опостореорной, т.е. вероятность выполнения одного события от другого.

В формуле (*) выразим числитель

(число шаров с меткой АБ) = P(А и Б) * (Общее число шаров)

и подставим в (**) получим

P(А|Б)=(Р(А и Б)* (Общее число шаров))/ (число шаров с меткой Б)= (Р(А и Б))/(Р(Б))

 

Аналогично предыдущему случаю можно вычислить вероятность появления шара с меткой Б при условии извлечения шара с меткой А.

P(Б|А)= (Р(А и Б))/(Р(А))

 

Если в обоих формулах выразить числитель и приравнять, то получится следующая зависимость:

Р(А|Б)*Р(Б)=Р(Б|А)*Р(А) – закон Байеса

Из четырех экспериментов, которые можно произвести над двумя объектами необходимыми являются только три, значение четвертого эксперимента всегда может быть выражено через три других. Замечание: Особенностью метода Байеса является то, что сам он в чистом виде не применяется, однако существует множество других методов построенных на принципах Байесовской вероятности, которые применяются для решения практических задач.

Метод MYCIN

Этот метод позволяет организовать вычисление достоверности тех или иных событий при подъеме по дереву вывода с использованием не надежных знаний. Впервые это метод был предложен и использован в экспертной системе, которая занималась анализом наличия микроорганизмов в крови.

Система называется MYCIN, отсюда получил название и метод. Основная идея его состоит в следующем: Вершинам дерева, графа описывающего структуру вывода, присваиваются коэффициенты доверия (cf) которые могут принимать значения в интервале от -1 до 1 при этом -1 абсолютная лож а 1 абсолютная истинна. Наличие коэффициентов позволяет оценить достоверность любого события участвующего в цепочке вывода и при этом будет учтен весь предшествующий вывод до этой вершины. Коэффициенты доверия, приписанные листьям, по сути, отражают вероятность происхождения того или иного события. Вершины более высокого уровня, т.е. те, которые имеют предшественников, при подъеме от листьев к корню имеют коэффициент доверия самого этого события, который получен на основе коэффициентов доверия предшествующих вершин, и коэффициент доверия правила, на основе которого получен этот вывод, т.е. метод позволяет учитывать, что ненадежными могут быть не только факты, но и правила вывода.

Для листьев коэффициенты обычно задаются на основе знаний эксперта. Коэффициенты доверия для правил (cfправ) могут быть рассчитаны на основе Байесовской вероятности по правилу:

cf(A,Х) - коэффициент доверия А при условии что произошло Х

В том случае если вершине предшествует несколько вершин, связанных одним из известных типов связи, то в зависимости от типа связи определяется правило вычисления доверия события, делается это следующим образом:

  

 cfпр                                     

 

       S

 

 

cfx       cfy

При таком виде коэффициент доверия события рассчитывается как произведение коэффициента доверия правила и коэффициента доверия предшествующего вывода, который определяется на основе коэффициентов доверия событий, входящих в вывод и на основе существующего типа связи S.

cfA = cfпр * cfпредш_вывода

Коэффициент доверия предшествующего вывода в зависимости от типа связи определяется так:

Пусть S=И тогда коэффициент доверия предшествующего вывода определяется как минимум из коэффициентов доверия событий Х и У

cf пред = min(cfx , cfy)

cf пред(A, X&Y) = min(cfx , cfy)

Пусть S=ИЛИ тогда коэффициент доверия предшествующего вывода определяется как максимум из коэффициентов доверия событий Х и У

cf пред = max(cfx , cfy)

cf пред (А, XvY)= max(cfx , cfy)

 

Замечание: Существует довольно много методов, которые используют пересчет коэффициентов доверия (или их эквиваленты) при подъеме по дереву вывода. Во всех этих методах коэффициенты доверия для связи И/ИЛИ определяются также, как и в методе MYCIN. Различия существуют при определении коэффициентов доверия связи типа КОМБ.

Рассмотрим, каким образом это реализуется в MYCIN.

Пусть S=КОМБ

Коэффициенты доверия предшествующего вывода принимают значение абсолютная истина или абсолютная лож в том случае, если одна из веток имеет такие значения.

Если ни одна из веток не имеет абсолютного значения, то расчет коэффициентов выполняется на основе одной из трех формул. Однако область определения этих формул является взаимно пересекающейся, поэтому чтобы избежать ошибок формулы применяются в том порядке, в котором они пронумерованы.

Чтобы избежать противоречивой ситуации формула (3) может быть заменена на следующую формулу:

сf пред = (cf(А,Х)+ cf(А,У))/(1-min(cf(А,Х), cf(А,У)))

Область определения сохраняется. В этом случае порядок проверки формул в системе является не существенным.

 Вопрос №10










Последнее изменение этой страницы: 2018-05-10; просмотров: 187.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...