[
Введите текст]
74
СИСТЕМЫИСКУССТВЕННОГО ИНТЕЛЛЕКТА И ПРИНЯТИЯ РЕШЕНИЙ.
ОПТИМИЗАЦИЯ БАЗ ЗНАНИЙ НЕЧЕТКИХ ЭКСПЕРТНЫХ СИСТЕМ
ферная емкость. В дальнейшем эксперименты показали, что необходимо увели-
чить их число до 8 (добавились возраст пациентки и резус фактор крови).
Эксперт на основе своих знаний с использованием информации из литера-
турных источников по предметной области произвел разбивку входных пере-
менных на небольшое число интервалов (3 – 6 для одной переменной). Некото-
рые переменные затруднительно разбить таким образом, поэтому далее была
использована программа WizWhy предприятия WizSoft (эта система предназна-
чена для поиска логических закономерностей в данных методом ограниченного
перебора, ее описание приведено в разделе 1.2.2). В ней происходила автомати-
ческая сегментация параметров, результаты которой корректировались экспер-
том.
На основе априорной информации о предметной области (знания эксперта,
литературные источники) был сформирован начальный набор логических пра-
вил. Он был дополнен наиболее значимыми и безошибочными правилами, най-
денными системой WizWhy (всего получилось порядка 20 правил). Система
WizWhy имеет ряд недостатков, из-за которых она может использоваться лишь
как вспомогательное средство:
•
значительно ограниченное участие эксперта в процессе отыскания зависи-
мостей, т.е. невозможность использования априорной информации (отсут-
ствует возможность редактирования полученного системой набора правил,
невозможно повлиять на сегментацию параметров);
•
отсутствие иерархии правил, что приводит к громоздкости правил и уве-
личению их числа;
•
ориентированность на большие объемы обучающей выборки.
Затем была проведена структурно-параметрическая оптимизация набора
правил. В начале этой процедуры число правил автоматически увеличилось до
50 – 60.
По достижении предельных значений ошибки на обучающей выборке
(
когда ошибка перестала уменьшаться) произошло упрощение базы знаний за
счет отбрасывания незначащих правил и связей между правилами. В результате
был получен набор из примерно 40 правил. В начале работы, когда успешной
оптимизации не происходило, производилось уточнение сегментации и добавле-
ние новых входных параметров.
Далее, полученная база знаний была проанализирована с целью отбрасыва-
ния некоторых правил, не отражающих тенденцию или противоречащих знаниям
о предметной области (такие правила обычно охватывают 1 – 2 случая из обу-
чающего множества). Данная процедура позволяет избежать "переобучения"
системы (то есть запоминания конкретных примеров вместо нахождения тен-
денции) в условиях малой выборки.
Уменьшение базы знаний до 31 правила привело к тому, что система оши-
балась дополнительно в нескольких случаях по сравнению с предыдущей, но та-