УСТОЙЧИВОСТЬ. Система устойчива, если ограниченное воздействие приводит к ограниченной реакции системы. Операторный полином d a ( D) y t b ( D) u t D dt n n 1 a (D) a n D a n 1 D ... a 0 Шаг квантования 1: x ( t ) x ( t 1) - оператор Набла (сдвига) 0 – предел слева (система выключена). Она д.б. неограниченна слева. Пример: z 2 3z 1 a () x t ( 2 3 1) x t x ( t 2) 3x ( t 1) x ( t ) Для непрерывных: Полином устойчивый если все его корни в левой полуплоскости. В устойчивых системах переходный процесс затухает. W(p) =Y(p)/U(p) – передаточная функция системы t - весовая функция (p 1)B(p) - не устойчивый, т.к. p=1 вне левой полуплоскости (p 1)A(p) (p 1)B(p) - можно сократить, но пренебрегая переходным процессом. W ( p) (p 1)A(p) Запрещается сокращать неустойчивые многочлены. W ( p) Для дискретных: Если на границе или внутри единичного круга – не устойчивая. a () x t 0 Пример. a(z)=z-1/2 x0=1 1 1 a () x t x t x t x t 1 x t 0 2 2 x0=x1/2 x1=2 x1=x2/2 x2=4 Пример: a (z) z 2 z 1 D 3 z 1 i 3 2 2 1 i 3 1/ 4 3/ 4 1 2 Не уст. В пространстве состояний для системы с непрерывным временем: все СЗ матрицы А должны лежать в левой полуплоскости (или отрицательная вещественная часть), тогда устойчивая. x(t) – скаляр, u(t) – вход, y(t) – выход dx D Ax bu dt (D A) x bu x (D A) 1 bu y t c T x t - в “c” все нули, кроме тех, что соответствуют “х” (там единицы) y t W(D)u y W(p) c T (p A) 1 ( b,c,A) - реализация системы в пространстве состояний Пример: A 1 2 3 4 1 2 2 5 2 3 4 5 33 - неустойчивая 2 УПРАВЛЯЕМОСТЬ Если за конечное время систему можно перевести из начального состояние в конечное ограниченное состояние, то система управляема. x t 1 Ax t bu t x0 x 1 Ax 0 bu 0 x 2 Ax 1 bu 1 A 2 x 0 Abu 0 bu 1 Критерий Калмана (Качмажа??): если матрица управляемости не вырождена ( 0 ), то система управляема и наоборот. y (b,Ab,...,A n 1b) X - матрица управляемости Пример: A – диагональная b – столбец не нулевых эл-тов (A=I) => (b,b,b…)=y – неуправляемая. Пример: A 1 0 0 0 b 1 0 y (b,Ab) 1 1 - неуправляемая 0 0 Геометрическая интерпретация неуправляемости: b Ab X – вне => неуправляемая, т.к. из плоскости нельзя вырваться. An-1b СТАБИЛИЗИРУЕМОСТЬ. Пространство состояний: b( p) T W ( p) c (p A) 1 b - для управляемых систем дробь несократима. a ( p) Если возможно построить такую обратную связь (ОС): u=ky, что замкнутая система устойчива, то объект стабилизируем и матрица (A,b) – стабилизируемая и наоборот. Если есть общие множители, то не стабилизируемая. Управляемая => стабилизируемая всегда, но не наоборот. Док-во: 1 .... n - собственные значения (СЗ) – сами выбираем из, например в левой полуплоскости => можно построить матрицу замкнутой системы с ОС A+kbcT, где dx Ax kbc T x (A kbc T ) x и 1 ... n СЗ(для уст ) dt Стабилизируемая, но не управляемая: dx 1 dt A11x 1 A12 x 2 dx 2 A 22 x 2 dt ( x 1 ,x 2 ) x x1 – управляемая часть x2 – неуправляемая Если A22 – устойчива, то замкнутая система стабилизируется (A11 – устойчива), то: dx Ax dt A A A 11 12 0 A 22 НАБЛЮДАЕМОСТЬ. По выходу нужно точно восстановить состояние. dx Ax ( t 0 ,t 1 ) -измеряем y. Надо построить точную оценку состояния. dt y c T x Если задача разрешима, то система наблюдаема и матрица (A,c) – наблюдаема и наоборот. d2x A 2x 2 dt dx T c Ax dt d2x T 2 c A x dt 2 d3x T 3 c A x dt 3 cT A cT A 2 T 3 Матрица наблюдаемости: c A ... c T A n 1 Критерий наблюдаемости: Если матрица наблюдаемости невырождена, система наблюдаема (можно выразить через y??). Пример: A 0 1 0 0 T c (0,1) c A (0,0) T b 0 1 (A,c) 0 1 - вырождена => не наблюдаема 0 0 АЛГОРИТМ НАБЛЮДАТЕЛЬ. x* - выход наблюдателя (оценка состояния х) dx * Ax * q ( y c T x*) (1) – правая часть - наблюдатель dt q – коэффициент усиления ( ycT x*) - невязка (ошибка восстановления) t (2) ( t ) x ( t ) x *( t )0 dx Ax (1) Из dt d A qc T (A qc T ) dt Если q: (A qc T ) - устойчивое, то наблюдатель сколь угодно точно оценивает переменную состояния (2). Можно регулировать скорость сходимости и точность с помощью СЗ 1... n Если первая компонента восстановима, а вторая – нет, то система частично ненаблюдаема. Вход наблюдателя = выход системы. Наблюдатель – человек. Алгоритм наблюдателя с управлением. К алгоритму наблюдателя добавляем компоненту управления “bu”: dx * Ax *q ( y c T x*) bu (1) dt dx Ax bu (2) dt Проверка: из (2)-(1), тогда исчезнет bu и всё будет сходиться. При решении задачи – декомпозиция – разделение на 2 части: - моделируем, если система полностью управляема (задача синтеза регулятора) - заменяем ненаблюдаемые компоненты состояния их оценками. u y объект наблюдатель x* регулятор dx Ax bu (A Bc T ) x dt (A Bc T ) - если объект управляем, то матрица устойчива u=cTx – стабилизация по состоянию Если состояние не полностью наблюдаемо, то u=cTx* - можем стабилизировать по выходу (y). Алгоритм наблюдателя с помехами (шум). dx Ax bu F dt y cT x CИСТЕМА УПРАВЛЕНИЯ. Состоит из объекта управления, регулятора и связей. t=0,1,2,…… u t U t ( y 0t 1 ,u 0t 1 ,W0t ) , W – возмущение. U 0 ( t ) - стратегия управления. w u объект y регулятор Управление трёх типов: - ООС (неважна природа возмущения) - Комбинированное (в законе управления есть W) - Программное управление (индукция) как функция времени. АДАПТАЦИЯ dx f ( x ,u ) u k T x -управление k=k(t) dt V(x)>0 при x 0 асимптотически устойчива по Ляпунову: dV( x ) n V V du T f k ( x,u ) f V 0 - должна убывать dt x k u dt k 1 Пример: dx Ax V( x ) x T Lx dt AL LA T 0 Док-во: A - гурвицова матрица – СЗ в левой полуплоскости. L – положительно определена(т.е. положительна при любом не нулевом х) dV dx T 0 xTAT dt dt T dV dx dx Lx x T L x T A T LX X T LAX X T (A T L LA ) x 0 x 0 dt dt dt T A L LA 0 Чтобы адаптировать систему не обязательно знать полную инфу о системе, т.е. адаптация для целого семейства объектов. Для дискретного времени: y t x Tt y t - измеряемый выход x Tt - наблюдаемый вектор входов - неизвестный вектор параметров Геометрическая иллюстрация – получить общую точку пересечения плоскостей. Алгоритм Качмажа. Последовательно 0 .... n будет сходиться к . За N итераций можно попасть в , если плоскости под прямым углом. a t 1 min x Ta y 2 t t Строим функцию Лагранжа: L(a ,) a t 1 ( x Tt a y t ) 2 L 0 a L 2(a t 1 ) x Tt 0 a x Tt a t 1 2 Подставляем ‘a’ в x Tt a y y и находим коэффициент Лагранжа . Затем подставляем в a x Tt t1 и находим а. 2 … a t 1 ... t t - коррекция против помех. Если t =0 – обучение прекращается. Фактор помех устраняется временной избыточностью. y t x Tt e t Мe t 0 e t - белошумная последовательность. Me e2 2 ВОЗМУЩЕНИЯ. Стохастическая аппроксимация (Роббинса-Монро): x t 0 t 1 2 t - первое условие t - второе условие. t 1 1 Пример: t t 1 t c1 t 1 c 2 t t Если темп изменений велик, то может быть срыв слежения. Возмущения по темпу: - Быстрые (координатные: ветер) - Медленные (параметрические: износ инструмента) Квазистационарность – в среде изменение такие медленные, что в сравнении с координатными возмущениями ими можно пренебречь. Теория о непрерывных возмущениях: dx f ( x ), f ( x ) - условие Лившица: f (x 2 ) f (x1 ) L x 2 x1 dt удовлетворяет). x Возмущённая система: x f (X) f ( x ) f ( x ) - возмущение. (например, x не Если f ,то при 0: x X 0 Пример: реле идеальное не удовлетворяет Лившицу (L=inf) Реальное реле удовлетворяет: L – большое. y t T x t T - параметрическое возмущение x t - координатное возмущение Пример: y t T x t ku t k –коэф.усиления (известен) Цель: y t 0 1 Если T известен, то u t T x t (не реализуемо) k 1 Если T не известен, то u t Tt 1 x t k Введём новую переменную: Yt y t ku t Теперь в алгоритме Качмажа (см.выше) вместо yT подставляетм YT Разделение процессов во времени. Режимы: - Пакетный (через буфер) - Реального времени (Качмажа) xt yt объект ut компенсатор t 1 идентификатор Компенсатор – блок быстрых переменных. Регулятор. Идентификатор – блок медленных переменных. Вычисляет оценки параметров в реальном времени. Идентификационный (отождествляющий) подход: - Сначала решаем задачу в полной инфе - Затем заменяем вектор-параметр оценками. Пример: х – быстрые переменные y – медленные dx dt f ( x , y) dx F( x , y) dt 1 Пребрегаем : dX f (X,Y) F( x, y) 0 dX f (X,G (X)) dt Y G ( x ) трение Теоретическое обоснование см. теорию Тихонова А.Н. РАСПОЗНАВАНИЕ ОБРАЗОВ. КЛАССИФИКАЦИЯ. Два класса задач: - В детерминистской постановке (т.е. классы разделены a priori и вероятность правильного разделения p=1) - В стохастической постановке (критерий качества: вероятность ошибки классификации). Песть существует: Тогда f ( x ): f ( x ) 0, xA f ( x ) 0, xB Линейное разделение: f(x) sign( T x 0 ) . Возможно, если “А – выше, B – ниже”, т.е. формы должны быть выкуклые. ( x ):R n R N , N n, чтобы F( x ) T ( x ) 0 Теорема Вейерштрасса: 0 многочлен p(x): f (x) p(x) , xk Можно построить пространство, где образы A и B разделимы. Пространство функций от признаков – спрямляющее. Если подвигать разделяющую плоскость, то она ей и останется (в детерминистской постановке) и можно за конечное число итераций разделить A и B с окрестностью . Свойство конечной сходимости: последовательность оценок стабилизируется и есть точное разделение. Правильное гарантируется только после завершения алгоритма. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ. ( x 1 ,....,x n ) x n p( x 1 ,....,x n |) L k () - параметр (например, М или D) Функция потерь: d( ,) 0 - истинное - оценка Средний риск: Md (,) d 0 n Функция правдоподобия: p ( x k |) k 1 Надо искать такое , чтобы функция правдоподобия была максимальной. L n () max - оценка метода макс.правдоподобия. Критерий Вальда: нужно осмотреть (1/e)%, чтобы выработать критерий. Пример: x k Vk P( x |) V ~ N(0,D) 1 2D e ( x ) 2 2D ( x ) 2 ln( P( x |)) ln( ) 2D 2D 2 n ( x ) k 2D k 1 1 n n k 1 k 1 min ( x k ) 2 МНКв 2( x k ) 0 n 1 x n - выборочное среднее. n Пример: Распределение Лапласа. v p( v) A e ln( p( v)) ln A x k n x k 1 k min Центральная предельная теорема: 1 n (x k ) ~ N(0,) n k 1 Процедура построения робастных оценок. Выборочная медиана. см. Huber Механизм огрубления метода наибольшего правдоподобия. РАЗНЫЕ ПОНЯТИЯ. Гурвицова матрица – СЗ в левой полуплоскости. Ранг: min(a,b) – a и b – кол-во ненулевых строк и столбцов. Вероятность – мера в пространстве элементарных исходов. Белый шум – процесс постоянной спектральной плотности. a priori – до опыта a posteriori – после опыта