3.3 Представление и обработка неопределенности в продукционных системах

 В реальных условиях далеко не всегда эксперт может с полной уверенностью сказать, что «Если А, То B». Скорее всего при работе вместе с инженером по знаниям над заполнением  БЗ эксперт будет говорить о какой то возможности того, что «Если А, То В».

 Точно также, как и в ходе диалога пользователя с системой на вопрос об истинности факта А он не всегда сможет однозначно ответить «истинно» или «ложно». 

Для того, чтобы ЭС по своим возможностям приближалась к возможностям человека в продукционной модели необходим механизм , позволяющий учитывать и обрабатывать эту неопределенность. Одним из таких механизмов являются коэффициенты уверенности. В практике экспертных систем были разработаны различные модели и алгоритмы для введения в БЗ и расчета таких коэффициентов в ходе логического вывода. Подробнее об этом можно прочитать в [11, 1, 2] . Первоосновой для них стали положения теории вероятностей, но многие выходят за рамки математических формул этой теории да и оперируют не статистическими величинами, а субъективными. Рассмотрим один из подходов.

При вводе продукционного правила эксперту предлагается оценить коэффициент силы правила k Î[0;1]. Тогда в БЗ будут присутствовать не только правила, но и эти коэффициенты, что запишем так:

A→B, к.

или

A→B, к(А,В).

 

В ходе работы системы, при диалоге с пользователем он также может вводить некоторые коэффициенты, которые интерпретируются как коэффициенты к(А) уверенности пользователя в том, что условие А выполняется (факт А является истинным). Тогда на основании правила можно вычислить коэффициент уверенности к(В):

к(В) = к(А)*к(А,В).

Очевидно, что при наличии графа вывода, который представляет собой связь между всеми правилами БЗ (см. рис3.1), при известных коэффициентов силы правил и коэффициентах уверенности можно в итоге вычислить коэффициент уверенности в истинности конечной проверяемой гипотезы. Так, для примера возьмем на рисунке 3.1 цепочку рассуждений  А →  G → K. Уже по первому ответу пользователя можно определить к(А) и при известных коэффициентах силы правил k1, k2 вычислить k(К):

 

k(K) = k(A)k(А,G)*k(G,K).

 

Если k(K) больше некоторого установленного порога (этот порого обычно принимается равным более 0,5), то можно считать, что гипотеза К верна. Если k(K) меньше порога, то можно подключить к выводу новую цепочку (см. рис.3.1), которая по идее должна выступить в качестве дополнительного свидетельства в пользу К:

B →  G → K.

Обозначим свидетельства в пользу К, полученные по первой и по второй цепочке вывода соответственно е1 и е2:

е1 = k(A)k(А,G)*k(G,K)

е2 = k(B)k(B,G)*k(G,K),

тогда итоговая оценка истинности проверяемой гипотезы может быть вычислена на основании формулы сложения независимых событий из теории вероятностей:

k(K) = e1 + e2 –e1e2.

 

Отметим, что более правильным было бы говорить  о двух независимых цепочках вывода G – через A и через B (мы предполагаем, что эти А и В не зависят друг от друга). Соответственно и вычислять сначала по двум независимым цепочкам вывода k(G) на основе приведенной выше формулы, а потом уже k(K):

k(K) = k(G)k(G,K).

Как быть, если в левой части правила стоит сложная логическая конструкция, т.е. в ней присутствуют связки вида «И» (&), «Или» (or), «Не»? Для этого случая могут быть применены формулы комбинирования, которые применяются в теории нечетких множеств и нечеткой логики. Если в левой части стоит не:А, то принимается, что k(не:А) = 1- k(А). Если А есть сложная конструкция вида «А1 & А2 & А3», то:

k(A) = min { k(A1), k(A2), k(A3) }.

Если в конструкции присутствует связка or («Или»), то применима следующая формула:

k(A) = max { k(A1), k(A2), k(A3) }.

В медицинской ЭС MYCIN (см. например, [11]), которая стала одним из самых известных свидетельств возможностей экспертных систем, на базе которой были предложены и апробированы многие методы, эта модель коэффициентов уверенности была модернизирована.

Проблема возникла, когда исследователи столкнулись со следующей ситуацией. Пусть одна цепочка вывода по одним данным может говорить о возможности возникновения события с уверенностью 0,8. То есть , очевидно, выступать за это событие. Другая же цепочка вывода, пользуясь своими данными, подтверждает возможность события только с коэффициентом 0,2.  Возник вопрос: «значение свидетельства e2=0,2 подтверждает гипотезу с коэффициентом 0,2 или, напротив, опровергает гипотезу с коэффициентов 0,8?».

Для разрешения подобных вопросов в MYCIN предложено коэффициенты уверенности применять в пределах от -1 до +1. , где k=-1 означает полное опровержение факта, а к=+1 – его полное подтверждение.

Тогда применяются следующие формулы:

- если и e1, и e2 оба больше 0, то используется обычная формула сложения;

- если e1, и e2 оба меньше 0, то:

е = e1- e1+ e1e1;

- если одно свидетельство подтверждает (опровергает), а другое опровергает (подтверждает):

e = (e1+e2)/(1 – min (|e1|, |e2|)).

Если  свидетельств больше, чем два, то они комбинируются в формуле последовательно. При этом порядок подставноки свидетельств в формулу не важен.

Как отмечается в литературе, названная модель дееспособна для случаев, когда правила полностью обратимы, т.е. из А →B следует справедливость обратного не:А →не:B, что на практике далеко не всегда верно.

Читать дальше:

3.4 Байесова модель. ч.1



Похожие статьи:

Тема 2. Информация в экономических информационных системах. Количество информации. Методы оценки ч.1
07 мая 2012,
Статистический подход (Шеннон, Хартли, Колмогоров 20-40е года) Количественно выраженная неопределенность состояния системы – энтропия. Получение информации связано с изменением степени осве ... Читать полностью

3.2 Продукционная модель (правила продукций). ч.3
11 июля 2012,
В работе машины вывода ЭС могут использоваться две стратегии вывода: - прямая стратегия вывода. В этом случае вывод осуществляется то данных (снизу вверх на рис.3.1), т.е. сначала у пользов ... Читать полностью

3.5 Сетевые модели и графы. ч.2
11 июля 2012,
Еще одним примером графовой модели знаний может служить так называемое дерево решений (дерево – это вид графа, в котором нет циклов). В дереве решений (рис.3.3) может быть заложен процесс выв ... Читать полностью

Резюме к 3 главе
26 июня 2012,
1. Модели представления знаний делятся на два типа – фор-мальные логические и эвристические модели. Соответственно определяется логический и эвристический метод рассуждений в СОЗ. Логически ... Читать полностью

Тема 6. Интеллектуальные технологии в экономических информационных системах. Технологии интеллектуального анализа данных (Data Mining, Knowledge discovery in databases). ч.2
05 июня 2012,
Методы ИАД являются дополнением традиционных методов статистической обработки данных (факторного, корреляционного, регрессионного и других видов анализа). Основной их особенностью является выявлени ... Читать полностью