26
интенсивность. Энергия смеси сигнал+шум на выходе инверсного фильтра
сравнивается с порогом, который устанавливается в период воздействия на
входе только шума. Этот порог находится выше уровня энергии шумового сиг-
нала. Превышение порогового уровня принимается за наличие на входе реали-
зации (сигнал+шум). Коэффициенты инверсного фильтра и уровень порога из-
меняются во времени в зависимости от текущего значения уровня шума при
воздействии на входе только шума. Поскольку эти параметры (коэффициенты и
порог) используются детектором VAD для обнаружения речи, сам VAD не мо-
жет на этой же основе принимать решение, когда их изменять. Это решение
принимается вторичным VAD на основе сравнения огибающих спектров в по-
следовательные моменты времени. Если они аналогичны для относительно
длительного периода времени, предполагается, что имеет место шум, коэффи-
циенты фильтра и шумовой порог можно изменять, то есть адаптировать под
текущий уровень и спектральные характеристики входного шума.
VAD с обработкой в спектральной области удачно сочетается с речевым
RPE/LTP-LPC кодером, так как в процессе LPC анализа уже определяется оги-
бающая спектра входного воздействия, необходимая для работы вторичного
VAD.
Формирование комфортного шума
Формирование комфортного шума осуществляется в паузах активной речи
и управляется речевым декодером. Когда детектор активности речи (VAD) в
передатчике обнаружит, что говорящий прекращает разговор, передатчик оста-
ется еще включенным в течение следующих пяти речевых кадров. Во время
первых четырех из них характеристики фонового шума оцениваются путем ус-
реднения коэффициента усиления и коэффициентов фильтра LPC анализа. Эти
усредненные значения передаются в следующем пятом кадре, в котором содер-
жат информацию о комфортном шуме (SID кадр).
В речевом декодере комфортный шум генерируется на основе LPC анализа
SID кадра. Чтобы исключить раздражающее влияние модуляции шума, ком-
фортный шум должен соответствовать по амплитуде и спектру реальному фо-
новому шуму в месте передачи. В условиях подвижной связи фоновый шум
может постоянно изменяться. Это значит, что характеристики шума должны
передаваться с передающей стороны на приемную сторону не только в конце
каждого речевого всплеска, но и в речевых паузах так, чтобы между комфорт-
ным и реальным шумом не было бы резких рассогласований в следующих ре-
чевых кадрах. По этой причине SID кадры посылаются каждые 480 мс в тече-
ние речевых пауз.
Динамическое изменение характеристик комфортного шума обеспечивает
натуральность воспроизведения речевого сообщения при использовании систе-
мы прерывистой передачи речи.
Экстраполяция потерянного речевого кадра
В условиях замираний сигналов в подвижной связи речевые фрагменты
могут подвергаться значительным искажениям. При этом для исключения раз-