Лекция 5 ОБЩИЕ ВОПРОСЫ ОПТИМАЛЬНОЙ ОЦЕНКИ ПАРАМЕТРОВ СИГНАЛОВ ПРИ НАЛИЧИИ ПОМЕХ Вопросы оптимальных оценок параметров сигналов на фоне аддитивных помех типа белого нормального шума впервые (1946 г.) были поставлены и решались академиком В. А. Котельниковым. Эта работа оказала сильное влияние на развитие оптимальных методов радиоприема. Однако повышенный и широкоплановый интерес к вопросам оптимальных оценок параметров радиосигналов на фоне помех появился только после опубликования в 1950 – 1952гг. работ Ф. Вудворта. В качестве оптимальной оценки параметров сигнала на фоне белого шума принималась оценка по максимуму апостериорного распределения оцениваемого параметра. Поскольку при больших отношениях сигнал/шум оценка параметра по максимуму его апостериорного распределения асимптотически стремится к эффективной оценке, в работах Котельникова и Вудворта, а также в последующих работах других авторов в качестве дисперсии оценок фактически принимались дисперсии эффективных оценок. В связи с этим естественно возникает вопрос: насколько близка полученная таким образом оценка к истинному значению в зависимости от отношения сигнал/шум, времени наблюдения, вида сигнала и оцениваемого параметра? Позднее решались задачи о нахождении оптимальной оценки параметра сигнала при аддитивном приеме на фоне нормальных коррелированных помех, но и здесь в качестве дисперсии оценок как правило, принимаются дисперсии эффективных оценок без анализа получаемых при этом ошибок. Процесс наблюдения сигналов, осуществляемый человеком или каким-либо решающим устройством, состоит в обнаружении этих сигналов и в оценке некоторых их параметров, несущих полезную информацию. Техника наблюдения и оценки параметров сигналов в настоящее время достигли весьма больших успехов. Дальнейшее усовершенствование большинства радиотехнических и радиофизических приборов и устройств за счет улучшения конструктивных и технологических решений имеет свой предел, определяемый чисто физическими процессами – флуктуациями и помехами естественного и искусственного происхождения. 49 Это заставляет изыскивать принципиально новые пути решения задач передачи и приема сообщений, учитывающие статистические свойства различных характеристик передаваемых сообщений (сигналов) и помех (шумов). Шумы обусловливают случайный характер результатов наблюдения, и поэтому для обработки этих результатов используется статистический метод. Современная статистическая теория приема сигналов рассматривает приемное устройство как некоторый фактор, выделяющий полезную информацию об интересующем нас параметре из принимаемой смеси сигнала и шума. Формулировка задачи оценки параметров Пусть s(t , , q, r ,...) – сигнал, а n(t) – шум на входе приемного устройства. Тогда на входе приемника действует реализация x(t ) s (t , , q, r ,...) n(t ) 0t T . По принятой реализации х(t) необходимо наилучшим образом решить, какие именно значения из возможных в интервале изменений имеют параметры , q, r … . Наиболее полное значение об искомых параметрах дает послеопытная (апостериорная) плотность вероятности. Для одного параметра имеем апостериорную плотность вероятности – условную вероятность в зависимости от условия, что принята реализация x(t): Pps () P( / x) . По теореме об условных вероятностях P(, x) P( x) P( / x) P() P( x / ) , P ( ) P ( x / ) , Pps () P( / x) P( x) (1) где P() Ppr () – априорная плотность вероятности оцениваемого параметра ; P(x) – плотность вероятности реализации x(t ) ; [P(x)]-1 = g – неизвестный коэффициент, не зависящий от и определяемый из условий нормирования: 50 Pps ()d 1 , L L – область возможных изменений значения . 1. ФУНКЦИЯ ПРАВДОПОДОБИЯ P ( x / ) () Эта условная плотность вероятности при фиксированной реализации x(t) показывает, насколько одно возможное значение параметра более правдоподобно, чем другое. Приемное устройство, образующее на своем выходе апостериорное распределение оцениваемого параметра Pps gPpr , обычно называют ОПТИМАЛЬНЫМ приемным устройством. По значению Pps( ) принимается то или иное решение относительно наличия сигнала и оцениваемого параметра. Вынести решение при оценке одного параметра – это значит каждой возможной реализации х(t) на входе оптимального приемника необходимо поставить в соответствие некоторое значение параметра из интервала возможных значений , т. е. сформулировать некоторый ФУНКЦИОНАЛ f = f [x(t)], называемый оценкой. Из-за помех неизбежны ошибки, т. е. когда на входе сигнал с параметром 0 , однако принимается решение о величине (оценке) этого параметра . Каждая ошибка сопровождается некоторыми потерями, которые в свою очередь характеризуются функциями потерь. Наиболее часто используются: простая функция потерь w(, f ) 1 ( f ) , квадратичная функция потерь w(, f ) ( f ) 2 . Простая функция потерь минимизирует среднюю вероятность неправильного решения. В качестве оценки выбирается , при котором апостериорная вероятность Pps ( ) обращается в максимум максиморум. Квадратичная функция потерь минимизирует среднее отклонение, а сама оценка определяется соотношением 51 f Pps ()d, L т. е. координатой центра тяжести апостериорного распределения. Из-за случайного характера оценка характеризуется условной плотностью g(f/ ), вид которой определяет качество оценки. Обычно стремятся, чтобы g(f/ ) как можно более тесно группировалась вокруг . Смещение m(f) и рассеяние 2f оценки характеризуются соответственно: m( f ) ( f ) g ( f / )d , 2f ( f ) 2 g ( f / )d . Иногда вместо апостериорного распределения используют только функцию правдоподобия () . Априорное распределение Ppr( ) обычно неизвестно, и расчеты выполняются для менее предпочтительного в большинстве практических задач равномерного (на некотором интервале) распределения Ppr ( ). В качестве критерия оптимальности используется: эффективная оценка; минимизация среднеквадратичной ошибки; максимизация апостериорной вероятности Pps( ) или функции правдоподобия () . Установлено, что эффективная оценка существует тогда и только тогда, когда удовлетворяются условия Краммера: () = [x(t)] g (f/ ), n g(f/ ) = к (f- ), где [x(t)] – некоторая произвольная функция от х(t); к – коэффициент, не зависящий от . Рассеяние эффективной оценки ограничено снизу: ( 2 ()) мин 2 n() 52 1 , x (t ) где усреднение осуществляется по всем реализациям x(t). При использовании критерия по минимуму среднеквадратической ошибки необходимо вычислить интеграл 2 ( f ) ( f ) 2 Pps ()d L Этот интеграл трудно вычислить, так как сложно определить Pps( ) на всем интервале L. Основными преимуществами оптимизации по методу максимума Pps или ( ) являются: оценка по максимуму Pps( ) или ( ) совпадает с оценкой по минимуму среднеквадратической ошибки, если ( ) в среднем обладает свойством симметрии; если эффективная оценка существует, то она может быть найдена по максимуму Pps( ) ; эта оценка инвариантна по отношению к произвольному взаимно однозначному преобразованию ( ), что облегчает построение схем. При упомянутом ранее предположении о равномерном априорном распределении оцениваемых параметров ОПТИМАЛЬНОЕ УСТРОЙСТВО формирует функцию правдоподобия Λ( ,q, …) , а решающее устройство в результате анализа Λ( ,q, …) по методу максимума максиморума [в случае большого числа максимумов Λ( ,q, …) ] должно определить значения параметров ,q и так далее, при которых функция правдоподобия Λ( ,q, …) достигает максимума максиморума. Для простоты рассмотрим оценку одного параметра (рис.1). При этом всегда следует иметь в виду, что Λ( ) – случайная функция, имеющая в интервале возможных изменений L в общем случае, несколько максимумов. 53 () 0 m () m 0 а m 0 б Рис. 1. Два вида ошибок оценки параметра случайного процесса по методу максимума функции правдоподобия при большом (а) и малом (б) отношении сигнал/шум 2. ОПТИМАЛЬНАЯ ОЦЕНКА ПАРАМЕТРОВ ПОЛНОСТЬЮ ИЗВЕСТНЫХ СИГНАЛОВ НА ФОНЕ НОРМАЛЬНОГО ШУМА Достаточно полное и детальное описание случайного процесса ξ (t) дается многомерными плотностями вероятности. Плотность вероятности Wn(y1,…yn; t1,…,tn), называемая n-мерной, определяет вероятность того, что значения случайной функции ξ (t) в моменты времени t1,…,tn заключены соответственно в интервалы (y1 < ξ1 < <y1+ Δy1), … ,yn< ξn< yn+Δyn). При достаточно малых Δyi эта вероятность равна Wn(y1,…yn; t1,…,tn)· ·Δy1…Δyn. Многомерная плотность вероятности Wn(y1,…,yn; t1,…,tn) позволяет судить о связи между вероятными значениями случайной функции в произвольные моменты времени t1,t2,…,tn. 54 Для стационарных случайных процессов Wn(y1,…,yn; t1,…,tn) = = Wn(y1,…,yn; t1-t0,…,tn-t0), т.е. не изменяется при изменении начала отсчета по времени. Для нахождения функции правдоподобия Λ( ) оцениваемого параметра при оптимальном приеме сигнала на фоне нормального шума в течение некоторого фиксированного непрерывного промежутка времени широко используется понятие функционала плотности вероятности, как предельного случая многомерной плотности вероятности. Функционал плотности вероятности F[y(t)] = lim Wn ( y1 ,..., y n ) , 0 n где предполагается, что при дискретном наблюдении случайного процесса ξ (t) отсчеты берутся через равноотстоящие моменты времени Т Δ = ti+1- ti (i=1,…,n). Число выборок равно целому числу дроби 1 . Функционал плотности вероятности по своему характеру учитывает все статистические свойства случайного процесса ξ (t) на интервале (t,t+T). Рассмотрим многомерную плотность вероятности стационарного случайного процесса с корреляционной функцией K(ti-tj)=Kij= (t i ) (t j ) . Для такого процесса имеем: Wn ( y1 ,..., y n ) где Det K ij 1 (2n) n Det K ij 1 n exp yi y j Сij , 2 i , j 1 – определитель корреляционной матрицы порядка n n, Сij – элементы матрицы С Сij , обратной корреляционной матрице, причем элементы Сij определяются из уравнения вида 1, i k n Сij K jk ik 0, i k. j 1 Характеристика непрерывного случайного процесса y(t), являющаяся континуальным аналогом многомерного закона распределения при 55 T t i 1 t i 0 (при n ), называется функционалом плотноn 1 сти вероятности процесса y(t): F y (t ) lim Wn ( y ) . 0 n Для вычисления функционала F[y(t)] введем функцию (ti , t j ) lim 0 Сij 2 , которая может быть определена из интегрального уравнения T (ti , t j ) K (t j , t k )dt j (ti t k ) , 0 где (ti t k ) – дельта-функция Дирака, получающеюся из уравнения n С ij 2 K jk ik при переходе к пределу при 0 . j 1 Заметим, что поскольку K ij K ji , то Сij С ji , (ti , t j ) (t j , ti ) . По аналогии с обратной матрицей Сij функцию (ti , t j ) будем называть обратно-корреляционной функцией. Предел показателя экспоненты функционала плотности вероятности процесса y(t) равен: cij 1 n 1TT lim yi y j 2 2 y (t1 ) y (t 2 )(t1 , t 2 )dt1dt2 , 0 2 i , j 1 200 n где T (t1 , t ) K (t , t 2 )dt (t1 t 2 ) . 0 56 Таким образом, с точностью до некоторых постоянных множителя g, не зависящих от конкретно рассматриваемой реализации процесса y(t) , функционал плотности вероятности можно представить в виде 1TT F [ y (t )] g exp y (t1 ) y (t 2 )(t1 , t 2 )dt1dt2 , 2 00 где функция (t1 , t 2 ) связана с корреляционной функцией K(ti-tj) интеT гральным уравнением (t1 , t ) K (t , t 2 )dt (t1 t 2 ) . 0 3. ФУНКЦИЯ ПРАВДОПОДОБИЯ ОЦЕНИВАЕМОГО ПАРАМЕТРА Функция правдоподобия оцениваемого параметра при приеме полностью известного сигнала s(t, ) на фоне аддитивного нормального стационарного шума получается путем подстановки в выражение для функциональной плотности вероятности нормального шума вместо y(t) функции n(t ) x(t ) s(t , ) . Получаем для функции правдоподобия параметра 1TT () g exp[ x(t1 ) x(t 2 )(t1 , t 2 )dt1dt2 200 1TT s(t1 , ) s(t 2 , )(t1 , t 2 )dt1dt2 200 TT x(t1 ) s (t 2 , )(t1 , t 2 )dt1dt2 ]. 00 Первый двойной интеграл в этом выражении не зависит от . T Введем функцию (t , ) s(t1 , )(t , t1 )dt1 . 0 T 1T Тогда ( ) g exp s(t , )(t , )dt x(t )(t , )dt . 0 20 Функция (t , ) с помощью интегрального уравнения может быть связана непосредственно с функцией корреляции исходного шума. 57 T Для этого обе части уравнения (t1 , t ) K (t t 2 )dt (t1 t 2 ) умножим на 0 s (t1 , ) и проинтегрируем по t1 , в результате чего получим TT T 00 0 (t1 , t ) K (t t 2 )s(t1 , )dt1dt (t1 t 2 )s(t1 , )dt1 s(t 2 , ) . С учетом выражения для (t , ) имеем T K (t t 2 )(t , )dt s(t 2 , ) . 0 Таким образом, введенная функция определяется из интегрального уравнения Фредгольма, где в качестве ядра фигурирует функция корреляции исходного шума. 58