" Н а у к а м о л о д ы х " , 2 6 н о я б р я 2 0 1 9 г . , А р з а м а с
П о с в я щ а е т с я 8 5 - л е т и ю в ы с ш е г о п е д а г о г и ч е с к о г о о б р а з о в а н и я в А р з а м а с е и
8 0 - л е т и ю п р о ф е с с о р а В я ч е с л а в а П а в л о в и ч а П у ч к о в а
432
4.
Матрица вероятности генерации наблюдения при известном
состоянии
.
Также для распознавания лиц помимо одномерных
используются псевдо-двумерные
и упрощенные
двумерные
скрытые марковские модели [1].
Перед применением СММ для распознавания лиц необходимо обучить
систему. Изображение лица разбивается на части, которые соответствуют
скрытым состояниям.
Процесс распознавания лиц происходит следующим образом.
Изображение разбивается на области прямоугольной формы, являющиеся
скрытыми состояниями марковской модели. Для наблюдения за состоянием
используется окно сканирования фиксированного размера, которые
последовательно передвигается с определѐнным шагом по всем участкам лица.
Извлеченные блоки пикселей, подвергнутые либо дискретно–косинусному
преобразованию, либо преобразованию Карунена – Лоэва, образуя набор
числовых данных.
Перед тем, как начать распознавание лиц при помощи скрытой
марковской модели, нужно провести обучение системы. Перед обучением
изображение лица разбивается на части, соответствующие скрытым
состояниям. В этих частях происходят вычисления средних значений векторов
наблюдения и соответствующих значений матрицы вероятностей наблюдений
для каждого состояния. При последовательном сканировании окном
наблюдения настраивается матрица перехода
и матрица наблюдений
, в
соответствии со структурой модели, и на основании наблюдаемых данных.
Результатом обучения является сформированная собственная для каждого лица
скрытая марковская
.
При распознавании лицо подаѐтся на вход скрытой марковской модели
каждого из лиц, и вычисляются вероятности того, что данная модель
соответствует входному лицу. В качестве ответа выбирается та модель, которая
имеет наибольшую вероятность соответствия данному лицу, если эта
вероятность больше порога неопределѐнности.
В случае если лицо было распознано как соответствующая некоторой
скрытой марковской модели, может быть произведена сегментация данного
лица с помощью алгоритма максимума правдоподобия (Витерби). То есть, с
помощью алгоритма Витерби определяется наиболее вероятное состояние для
каждого положения окна наблюдения [2].
В одномерных марковских моделях окно наблюдения последовательно
сканирует лицо сверху вниз или слева направо. Происходит разбиение
изображения на части в форме полос. Число наблюдений, полученное в
результате пробега окна по изображению, сверху вниз, накрывая
предшествующее окно на
пикселей, будет равно: