[
Введите текст]
14
СИСТЕМЫИСКУССТВЕННОГО ИНТЕЛЛЕКТА И ПРИНЯТИЯ РЕШЕНИЙ.
ОПТИМИЗАЦИЯ БАЗ ЗНАНИЙ НЕЧЕТКИХ ЭКСПЕРТНЫХ СИСТЕМ
компактно описаны в виде дерева. На практике деревья решений часто содержат
7
и более уровней иерархии, что затрудняет интерпретацию полученных правил.
При этом наличие в дереве решений листьев, которым соответствует небольшое
число примеров, может означать, что разбиение обучающей выборки на под-
множества происходило случайно и полученная иерархия правил не описывает
реальные зависимости.
Примерами систем, реализующих алгоритмы деревьев решений, являются
See5/C5.0 (RuleQuestResearchPtyLtd, Австралия), SPSS (SPSSInc., США), Deduc-
tor (ООО "Аналитические технологии", Россия).
2.
Алгоритмы ограниченного перебора
Данный подход был предложен в 60-х годах XX в. М. М. Бонгардом и в на-
стоящее время является одним из наиболее эффективных методов поиска логи-
ческих закономерностей в данных.
Алгоритмы ограниченного перебора вычисляют частоты появления комби-
наций элементарных логических событий в данных. Т.е. анализируются все воз-
можные конъюнкции вида:
1
2
...
l
T T
T
∩ ∩ ∩
,
при
0
l l
,
где
i
T
элементарные события,
1,...,
i
l
=
,
l
число событий в конъюнкте;
0
l
некоторое заданное число, ограничивающее перебор.
Примерами простых логических событий являются выражения:
;
;
;
x a x a x a a x b
= < > < <
,
где
x
какой либо параметр исследуемого объекта,
a
и
b
константы. На осно-
вании анализа вычисленных частот делается заключение о значимости той или
иной комбинации для прогнозирования значения зависимой переменной. Среди
конъюнкций выделяются те, которые характерны для одного из классов и не ха-
рактерны для других.
Одним из лидеров среди коммерческих продуктов, в которых реализован
описанный подход, является система WizWhy(WizSoft, Израиль). В данной про-
грамме в начале работы алгоритма производится эвристический поиск простых
логических событий, на которых потом строится весь дальнейший анализ. Учи-
тывая данные особенности, можно предложить простую тестовую задачу, кото-
рую система вообще не сможет решить
.
Авторы WizWhy акцентируют внимание на следующих общих свойствах
системы:
выявление всех "если – то"-правил;
вычисление вероятности ошибки для каждого правила;
определение наилучшей сегментации числовых переменных;
вычисление прогностической силы каждого признака;
обобщение полученных правил и зависимостей;
выявление необычных феноменов в данных;
использование обнаруженных правил для прогнозирования;
1...,6,7,8,9,10,11,12,13,14,15 17,18,19,20,21,22,23,24,25,26,...88