67
СИСТЕМЫИСКУССТВЕННОГО ИНТЕЛЛЕКТА И ПРИНЯТИЯ РЕШЕНИЙ.
ОПТИМИЗАЦИЯ БАЗ ЗНАНИЙ НЕЧЕТКИХ ЭКСПЕРТНЫХ СИСТЕМ
ГЛАВА 4. РЕШЕНИЕ ПРИКЛАДНЫХ ЗАДАЧ
4.1.
Классификация цветов
В данной главе будут продемонстрированы примеры решения различных
типов прикладных задач с использованием разработанного метода построения
нечетких продукционных систем.
Сначала рассматривается "Задача об ирисах Фишера". Информация для
обучения модели была взята из широко известного хранилища баз данных
"
UCIRepositoryOfMachineLearningDatabasesandDomainTheories", расположенного
в Интернете по адресу
.
Набор данных содержит 150 записей, несущих информацию о трех классах
примеров (по 50 объектов на класс). Классы соответствуют трем типам ирисов
("
IrisSetosa", "IrisVersicolour", "IrisVirginica"), которые различаются по четырем
признакам: "sepallength" ("длина чашелистика"), "sepalwidth" ("ширина чашели-
стика"), "petallength" ("длина лепестка"), "petalwidth" ("ширина лепестка"). Атри-
буты цветов измерялись в сантиметрах. Особенностью задачи является то, что
один из классов линейно отличим от двух других. Последние линейно неразли-
чимы.
Статистическая информация по обучающей выборке представлена в
табл. 4.1.
Из таблицы видно, что признаки "petallength" и "petalwidth" линейно связа-
ны с номером класса, т.е. малые значения данных признаков соответствуют пер-
вому классу ("IrisSetosa"), а большие – третьему ("IrisVirginica"). Друг с другом
эти параметры линейно связаны еще сильнее – коэффициент корреляции равен
0,9628.
Таблица 4.1
Признак
Минималь-
ное значение
Максималь-
ное значение
Оценка мат.
ожидания
Оценка стан-
дартного от-
клонения
Корреляция с
номером
класса
sepal length
4,3
7,9
5,84
0,83
0,7826
sepal width
2
4,4
3,05
0,43
-0,4194
petal length
1
6,9
3,76
1,76
0,9490
petal width
0,1
2,5
1,2
0,76
0,9565
До начала обучения системы принимается решение о разбиении областей
значений каждой независимой переменной на 2 равных сегмента (т.е. трапецие-
видные функции принадлежности соответствующих сегментам нечетких мно-
жеств имеют одинаковые ядра). Создается 3 выходных элемента системы типа
"
Нечеткий ИЛИ" для каждого класса. В обучающей выборке записывается 1 в