Нахождение функции управления в этом случае называется задачей синхронизации с обратной связью (feedback synchronization).
Простейшей формой обратной связи является статическая обратная связь, где уравнение регулятора выглядит следующим образом:
u(T) = U (хо, хі,...,хк, Т) (5.22)
для некоторой функции U : Rn х Rni,..., Rnk х R ^ Мт.
Более общей формой является динамическая обратная связь по состоянию:
(5.23)
(5.24)
= W(x0,xh ... ,xk,w,t), at
u(t) = U (xo, ХЬ...,ХЬ w, t),
где w Е R^; W : RNo x RNl x ... x RNk x R^ x R ^ R^; U : RNo x RNl x
... x RNk x R^ x R Rm.
Во многих практических задачах полная информация о состоянии систем Е0, Еі,...,Ек недоступна и только некоторые переменные выхода уі (і = 1,...,г) доступны для использования в законе управления. В случае, когда Еі - гладкие конечномерные системы, задача синхронизации с обратной связью по выходу может быть поставлена как нахождение уравнений регулятора в виде статической обратной связи
u(t) = U (yi,..., yr, t)
или в виде динамической обратной связи:
(5.25)
aw
df = W(yu...,yr,w,t),
(5.26)
u(t) = U (yi,..., Уг, W, t),
(5.27)
где w Е R^; yi Е Rpi; W : Rp1 x ... x Rpi x R^ x R ^ R^; U : Rp1 x ... x Rpi x R^ x R Rm, такой что цель (5.14) достигается в системе (5.21), (5.25) или (5.21), (5.26), (5.27).
Приведенное определение управляемой синхронизации позволяет формально ставить и решать задачи синтеза синхронизирующего управления. Некоторые из них будут рассмотрены далее.
Для анализа и синтеза систем синхронизации можно использовать известные результаты теории динамических систем и теории управления. Остановимся на задачах асимптотической координатной синхронизации, которую мы будем понимать как выполнение соотношения
lim x1(t) х2(t) I = О,
(5.28)
t-оо
где Х\, х2 - векторы состоянии синхронизируемых подсистем.
Синхронизация и конвергентность. В теории устойчивости динамических систем аналогом свойства (5.28) является конвергентность.
Как известно, система дифференциальных уравнений называется конвергентной [31], если она имеет единственное ограниченное решение, которое глобально асимптотически устойчиво, т. е. все решения системы сходятся к некоторому предельному режиму. Рассмотрим две идентичных системы:
(5.29)
Хі = F(хі, t), Х2 = F(X2, t).
Если x1(t), x2(T) - произвольные решения систем, то их можно рассматривать как решения одной и той же системы X = F(х, Т) с разными начальными условиями. Поэтому конвергентность системы X = F(х, Т) влечет асимптотическую координатную синхронизацию идентичных систем (5.29). Стандартным достаточным условием кон-вергентности (а значит, и синхронизации) является [31] равномерная отрицательность всех собственных чисел симметризованной матри
_ т
dF(x,t)
дх
. Это условие интер
цы линеаризованной системы дР^ +
претируется как устойчивость с запасом собственных движений подсистем. Колебательные системы, однако, часто находятся на границе устойчивости или являются неустойчивыми (если колебания хаотические).
В этих случаях и возникает вопрос об управлении синхронизацией.
Синхронизация и стабилизация. Особенности задач управляемой синхронизации проиллюстрируем для частного случая, когда модели синхронизируемых подсистем линейны по состояниям и управлениям:
Х1 = Лх1 + f (Т) + Ви1, (5.30)
Х2 = Лх2 + f (Т) + Ви2, (5.31)
где u1, и2 - управляющие воздействия, f (Т) - внешнее воздействие (ограниченная функция времени), матрицы коэффициентов Л, В имеют размеры п х п, п х м, соответственно. В этом случае уравнение для ошибки синхронизации е = х1 х2 также линейно:
(5.32)
ё = Ле + B(u1 и2)
и задача асимптотической синхронизации подсистем (5.30) и (5.31) сводится к стабилизации (обеспечению асимптотической устойчивости) уравнения ошибки (5.32). Очевидно, динамика ошибки синхронизации зависит от разности управлений и = и1 и2, т. е. достаточно рассматривать случай одного управления и синхронизировать подсистемы при помощи линейной обратной связи вида и1 = Ке, и2 = 0. При этом на систему (5.31) управление не влияет и ее движения выступают как задающие, эталонные по отношению к движениям системы (5.30). Системы управления с эталонной моделью (systems with reference models) хорошо известны в теории управления (в зарубежной физической литературе такие системы называют системами типа master-slave или drive-response). Для достижения цели синхронизации следует выбирать матрицу обратной связи К так, чтобы матрица А + ВК была устойчива (гурвицева), т. е. чтобы все корни ее характеристического многочлена det(A/ А ВК) имели отрицательные вещественные части.
Как хорошо известно из теории управления, если пара матриц А, В управляема, то выбором матрицы обратной связи К корни характеристического многочлена матрицы А + ВК можно сделать произвольными. При этом легко показать, что если матрица А не имеет правых собственных чисел, т. е. для синхронизации нужно только сдвинуть влево ее собственные числа, лежащие на мнимой оси, то, в силу непрерывной зависимости коэффициентов многочлена от его корней синхронизирующее управление может быть сколь угодно малым (в ограниченной области начальных условий).
Тем не менее, задача решается точно так же, поскольку уравнения ошибки совпадают.
Гораздо сложнее оказываются случаи, когда вместо векторов со-
стояния Х\, х2 наблюдению доступны лишь некоторые выходные переменные у1 = Схі, у2 = Сх2, где С прямоугольная I х ft-матрица. Существующие необходимые и достаточные условия стабилизируемое™ по выходу слишком громоздки и не являются окончательными даже для линейных систем.
Для формулировки простых достаточных условий удобно ввести передаточную матрицу W(А) = С(АІ А)-1 В. Рассмотрим для простоты случай I = т = 1, когда вход и выход скалярны. В этом случае W(А) = Ь(А)/а(А), где В(А), а(А) - многочлены степеней п1, п, соответственно, причем п1 п, а(А) характеристический многочлен матрицы А. Модель ошибки может быть преобразована к виду дифференциального уравнения пго порядка а(р)у = Ь(р)и, где р = d/dt - символ дифференцирования. Не умаляя общности, можно считать, что коэффициент ап при Ап равен единице: ап = 1.
Простой достаточный критерий стабилизируемости системы обратной связью и = Ку был установлен еще в конце 1940-х годов М.В. Мееровым: стабилизирующее К существует, если многочлен В(А) гурвицев (имеет все корни левее мнимой оси), а величина d=пп1 (разность порядков знаменателя и числителя передаточной функции), называемая относительной степенью системы равна единице или двум, причем при d = 2 коэффициент при Ап-1 положителен : ап-1 0. В качестве К можно выбрать достаточно большое по абсолютной величине число, знак которого противоположен знаку коэффициентов В(А) числителя передаточной функции: Ь0К 0. Отметим, что если d 3 или d = 2, но ап-1 0, то стабилизация (а значит, и синхронизация) обратной связью по выходу неустойчивых систем невозможна.
Синхронизация и наблюдатели. Больше возможностей для достижения синхронизации возникает при отсутствии структурных ограничений на управление в виде матрицы В у одной из систем.
Пусть, например, одна из систем (ведущая) реализована физически, но недоступна целенаправленному воздействию (управлению), а вторая система реализована в вычислительном устройстве и ее модель может быть задана более или менее произвольно. Вся система может описываться, например, уравнениями
Х1 = Ax\ + f(Т), y1 = Cx\, (5.33)
Х2 = Ax2 + u(t). (5.34)
Задача управления координатной синхронизацией в этом случае состоит в поиске функции и = U(yi, х2, t), обеспечивающей в замкнутой системе соотношение (5.28), интерпретируемое как восстановление состояния х1 системы (5.33) с помощью оценки х2. Такая задача хорошо известна в теории управления и называется задачей наблюдения, а ее решение дается так называемым линейным наблюдателем
Х2 = Ах2 + К(уі Cx2)+f (t), (5.35)
где К - матрица, подлежащая определению. При этом ошибка наблюдения e(t) = x1(t) х2(Т) будет подчиняться уравнению ё = (А-КС)е, а собственные числа матрицы АКС за счет выбора матрицы К могут быть выбраны произвольно при выполнении условия наблюдаемости 5 пары А, С.
Перечисленные выше системы синхронизации, основанные на стабилизации линейного уравнения ошибки, обладают полезными свойствами грубости и робастности. Грубость означает, что поведение системы мало меняется при малых изменениях ее модели, таких как учет неидентичности и нелинейности подсистем, взаимосвязей между ними, различия внешних воздействий и т.д.
Более того, можно показать, что если функции, описывающие дополнительные, неучтенные при первоначальном синтезе системы погрешности входят в правые части уравнений системы аддитивно и ограничены по какой-то норме величиной А, то предельная (при Т ^ то) норма ошибки ограничена величиной RA при некотором R 0, не зависящем от А, т. е. имеет тот же порядок, что и возмущающие факторы. Свойство грубости, сопровождающееся количественной оценкой отклонения поведения возмущенной системы от поведения невозмущенной, называется робастностью. Отметим особенность свойств грубости и робастности синхронизированных систем, состоящую в
5 Критерием наблюдаемости пары А, С является условие
rankjC, Ас,..., (А)п-1С} = п.
том, что эти свойства имеют место лишь по отношению к ошибке синхронизации, но не по отношению к поведению каждой из подсистем. Отдельные подсистемы при возмущении могут терять устойчивость и некоторые из их переменных могут неограниченно расти (например, маятники могут перейти во вращательный режим), но отклонение от синхронизма (ошибка синхронизации) будет оставаться ограниченным.
Синхронизация нелинейных систем. В физических задачах наибольший интерес представляет синхронизация сложных движений, возникающих в нелинейных системах.
Опишем коротко некоторые способы решения задач управления синхронизацией нелинейных систем. Для простоты предположим, что имеются две подсистемы, описываемые аффинными моделями:
(5.36)
Хі = M*i)+gi(*i)wi, Х2 = /2(*2)+Ы*2)и2.
Исходные подсистемы не связаны между собой. Поставим задачу координатной синхронизации подсистем: найти алгоритм управления
(5.37)
U = Ui (xi, Х2), i = 1,2,
такой, чтобы обеспечивалась цель управления (5.28). Решение задачи тривиально, если правые части (5.36) можно изменять произвольно и независимо, т. е. если т = n, gi(xi) = g2(x2) = In, где In - единичная п х n-матрица. Тогда, взяв, например, ui = 0, u2 = K(xi х2), где К 0 - коэффициент усиления, получим уравнение ошибки в виде
ё = / (xi(T)) / (xi(T) е) Ке, (5.38)
в котором xi(t) - заданная функция времени, являющаяся решением первого уравнения (5.36) при ui = 0. Если матрица Якоби д/
А(х) = (х) ограничена в некоторой области О, содержащей реше-д х
ние системы (5.36), то при достаточно большом К 0 собственные числа симметричной матрицы А(х) + АТ(х) 2КІп лежат левее мнимой оси при х е О. При этом система будет обладать свойством конвергентности в О, т. е. все ее траектории, лежащие в О, сходятся при t ^ ж к единственному ограниченному решению. Поскольку e(t) = 0 является таким решением, то к нему и сходятся все траектории. Таким образом, синхронизация двух систем имеет место при усилении взаимосвязи между подсистемами.
При этом поведение каждой из систем может быть и оставаться сложным, например, хаотическим. На самом деле для синхронизируемости систем не нужны гладкость правых частей и существование матрицы Якоби: достаточно потребовать выполнения условия Липшица I/(хі) f (х2)| L|x1 х21 для некоторого L 0.
Аналогичным образом для систем с условием Липшица можно построить и нелинейный наблюдатель, так называемый наблюдатель с большим коэффициентом усиления (high-gain observer)
Х2 = /2(Х2) + К(Х2)(У\ СХ2), (5.39)
где уі = Cxi. Работать такая система будет лишь при определенных ограничениях на L [176].
Оригинальная схема построения наблюдателей в задаче синхронизации нелинейных систем предложена в 1990 г. Л. Пекорой и Т. Кэрроллом [196]. Схема применима, если при разбиении уравнений динамики системы на группы, соответствующие наблюдаемым переменным у1 и ненаблюдаемым переменным z1
уі = Fy(уі, zi), (5.40)
Zi = Fz(уі, zi) (5.41)
вторая подсистема (5.41) обладает свойством конвергентности относительно z1. Тогда можно вектор наблюдаемых переменных у1 непосредственно ввести в уравнение наблюдателя, имеющего вектор состояния z2 и описываемого уравнением
(5.42)
Z2 = Fz(уі, Z2).
Из конвергентности следует, что z1(t)z2(t) 0 при t и, следовательно, в качестве оценки вектора состояния системы (5.40), (5.41) можно принять вектор (у1, z2). Условием работоспособности схемы может служить достаточное условие конвергентности (см.выше): собственные числа матрицы
dFz{y,z)
дг
dFz(y,z) dz
равномерно отрицательны при всех у, 2. Это условие легче поддается проверке, чем условие отрицательности условных ляпуновских показателей, предложенное в [196]. Обоснование для более общего случая можно найти в [140].
Интересно, что схему ПекорыКэрролла можно представить как предельный случай наблюдателя с большим коэффициентом усиления, имеющего структуру
У2 = Fy(У2, 22) + К(уі - У2), (5.43)
22 = Fz(у2, 22). (5.44)
Действительно, переписав уравнение (5.43) в виде
?ij2 = eFy(у2, 22) + (уі - У2), (5.45)
где е = 1/К - малый параметр, замечаем, что система (5.43), (5.44) относится к классу сингулярно-возмущенных. При этом вырожденная (редуцированная) система, получаемая при е = 0 и описывающая медленные движения имеет вид у1 = у2, 22 = F2(у1,22) т. е. совпадает с (5.42).
Поскольку система быстрых движений (5.43) асимптотически устойчива при достаточно большом К 0, ее решение у2(Т) близко к у1(Т) при достаточно больших К 0 и Т О, т. е. динамика наблюдателя (5.43), (5.44) определяется динамикой вырожденной системы (5.42).
Пример 5.7. Схема ПекорыКэрролла многократно применялась к передаче сообщений с помощью хаотических сигналов. В пионерской работе К. Куомо, А. Оппенгейма и С.Строгаца [117] используется передатчик сигналов на основе системы Лоренца, уравнения которой после масштабирования приведены к виду
!U = а(? и),
V = ги ? 20uw, (5.46)
W = 5uv Bw
При выборе параметров а =16, г = 45.6, В = 4.0 система обладает хаотическим поведением.
Уравнения приемника взяты в соответствии со схемой Пекоры-Кэрролла в виде
!Us = (vs us),
vs = ru vs 20uws, (5.47)
Ws = 5uvs bws.
Уравнения (5.47) похожи на (5.46), за исключением того, что правая часть (5.47) зависит не от своей переменной состояния us, а от переменной и, которая таким образом может рассматриваться как поступающий на приемник выходной сигнал передатчика. Система (5.46), (5.47) укладывается в схему ПекорыКэрролла при у = и, z = (v, w).
При помощи функции Ляпунова вида V = V(е2, ез) = 0.5е| + 4е| в работе [117] дано простое доказательство того, что системы (5.46) и (5.47) синхронизируются, т. е. невязка между их соответствующими переменными состояния асимптотически стремится к нулю. Для доказательства выписываются уравнения ошибки
(5.48)
ё = е2 20иез, ёз = 5ие2 Ьез,
и вычисляется производная функции V в силу системы (5.48). Вычисления показывают, что
V = е2(е2 20иез) + 4ез(5ие2 Ьез) == е| 4Ье|. (5.49)
Таким образом, V kV, где k = min{2, 2Ь} 0 независимо от величины сигнала и = u(t) и переменные ошибки е2(Т), ез(Т) сходятся к нулю экспоненциально. Поскольку ё1 = а(е2 е1), а 0, переменная е1 также сходится к нулю экспоненциально т. е. (5.47) является асимптотическим наблюдателем для (5.46).
Для передачи двоичного сигнала коэффициент b передатчика (5.46) изменялся, принимая значение b = 4.4, соответствующее двоичной единице, тогда как исходное значение b = 4.0 означало двоичный нуль. При изменении величины b в (5.46) до b = 4.4 в системе (5.47) резко возрастает уровень сигнала рассогласования е = и us, что позволяет установить факт передачи полезного сигнала. ?
Синхронизация и метод скоростного градиента. Для синтеза систем синхронизации можно применять и метод скоростного градиента, см. п. 2.4.2.
Пусть управляемая система описывается уравнениями (5.36). Введем целевой функционал
Q(x) = ^\xi -х2\2 (5.50)
и вычислим скорость его изменения в силу уравнения системы:
Q(x) = (xi - *2)T(/i + g1U - /2 - G2U2).
Затем вычислим скоростной градиент:
0Q
ди1
dQ_
ди2
= (Хі - Х2)Тgl,
= (Хі - Х2)Тg2, и выпишем алгоритм скоростного градиента для функционала (5.50):
(5.51)
ui = -у(хі - Х2)Тgi(xi),
U2 = -Y(X2 - Xi)Tg2(X2).
Как было замечено в [124], частными случаями алгоритма (5.51) являются описанные выше схемы. Например, алгоритм синхронизации линейной обратной связью (5.38) получается, если положить g1(x1)= Іп, g2(x2) = 0, y = К, наблюдатель с большим коэффициентом усиления (5.39) получается, если положить g1(x1) = 0, g2(x2)= g2C, Y = К, а схема Пекоры-Кэрролла (5.42) для случая, когда выход у1 входит в (5.42) линейно (Fz(у1, z2) = /(z2)+y1 g(z2)) получается, если положить g1(X1) = 0, g2(х2) = gC, Y = 1.
Условия, при которых алгоритм (5.51) обеспечивает синхронизацию, вытекают из общих теорем о достижении цели в системах на основе алгоритмов скоростного градиента [61, 80, 140].
Во многих случаях динамика синхронизируемых систем зависит от неизвестных параметров, недоступных при синтезе алгоритма син-хронизадии. В таких случаях для управления синхронизацией можно использовать законы адаптивного управления.
Следуя [6, 124, 136], изложим общую постановку задач адаптивного управления синхронизацией и схему решения для двух подсистем на основе метода пассификации. Рассмотрим N взаимосвязанных подсистем, описываемых уравнениями вида
Хі = Fi (xi,..., Xn , и, ?, t) і = 1,..., N, (5.52)
где ? Е - вектор неизвестных параметров. Пусть задана неотрицательная целевая функция Q(х1,... ,xN, t), малые значения которой соответствуют достижению синхронного режима.
Выбор целевой функции определяется желаемым типом синхронизации. Например, целевая функция может быть выбрана в виде (5.5), (5.15) или (5.50). Задача состоит в том, чтобы найти алгоритм адаптивного управления вида
и = U(Х1,... ,Xn, t, ?),
где ? Е - вектор настраиваемых параметров и алгоритм адаптации вида
? = ?(Х1,... ,Xn, t, ?),
так, чтобы цель управления
lim Q (х1(Т),..., xN (t), t) = 0 (5.53)
достигалась для всех ? Е Е, где Е - множество допустимых значений ?.
Отметим, что поскольку правые части Fi в (5.52) различны, поставленная задача охватывает случай неидентичных подсистем, представляющий наибольший интерес в задачах управления синхронизацией.
Далее рассмотрим более подробно случай двух подсистем: N = 2, хі Е со скалярным управлением и Е R1 и зададим естественную цель синхронизации:
lim |x1(t) х2(t) I = 0.
t^-ж
Вычтем уравнение второй системы из уравнения первой и предположим, что в полученном уравнении для вектора ошибки можно выделить линейную и нелинейную части и представить модель ошибки в следующем виде:
n
е = Ле + В ^ ?іф;(х1, х2, Т) + Bu, (5.55)
;=i
где Л - постоянная n x n-матрица; В постоянный n-мерный вектор; ?і - постоянные, но неизвестные коэффициенты, а функции ф; известны и измеряемы. Таким образом, предполагается наличие линейной и согласованной параметризации: как неизвестные параметры так и управление входят в уравнение ошибки линейно и, кроме того, пропорционально постоянному вектору В (например, нелинейности и управление входят только в одно из уравнений системы).
Модель ошибки (5.55) охватывает как традиционный для теории управления случай, когда управление входит только в одну из подсистем (5.52), так и случай, когда управление может воздействовать на обе подсистемы. В последнем случае предельное движение управляемой системы (синхронный режим), вообще говоря, неизвестно, даже если ошибка приблизилась к нулю.
Пусть измерению доступны, кроме функций ф;(хі, х2, Т), выходные переменные уі = Схі, і = 1,2. Алгоритм адаптивного управления может быть выведен, а достижение цели установлено методом скоростного градиента. Зададим основной контур управления в виде
N
и = ?о (уі - У2) + ^?; ф; (Хі, Х2, Т), (5.56)
І = 1
где ?о, ?; - некоторые настраиваемые параметры. Выбор такого закона управления мотивируется надеждой на то, что он в принципе способен решить задачу, поскольку существуют такие значения настраиваемых параметров ?;, і = 1, ...,N, что цель управления достигается. Действительно, если выбрать
?и = ?;, і = 1,... ,N, (5.57)
то при подстановке выбранных значений настраиваемых параметров ?;* и управления и в уравнение ошибки (5.55) все нелинейности исчезнут, уравнение примет вид
(5.58)
ё = [А ?0ВС] е.
и, если существует ?0# такое, что уравнение (5.58) асимптотически устойчиво, то закон (5.56), (5.57) в принципе обеспечивает синхронизацию. Однако в любом случае воспользоваться таким законом нельзя, так как он зависит от неизвестных параметров.
Для синтеза алгоритма адаптации воспользуемся методом скоростного градиента. Учитывая, что система содержит линейную по е часть, выберем квадратичную целевую функцию Q(е) = е Ре, е = х1 Х2, где Р = Р 0 - некоторая симметричная положительноопределенная матрица. Вычисляя скорость изменения введенной функции в силу системы (5.55), а затем градиент от скорости по настраиваемым параметрам, получим
Q = ет Рё = ет Р
Ае + В ?і + Ви
і=і
= е‘Р [А ?оВС] е + е1PBJ2 ?і)^
і=і
BQ тпв/ 4 BQ т тэг = ~e РВ(У' ~ У*) ду = РВіРі-д?о В?і
Для применимости алгоритма нужно, чтобы все величины в алгоритме управления были доступны измерению. По предположению, функции і(х1, х2, Т) доступны измерению.
Осталось обеспечить измеряе-мость величины е РВ, являющейся линейной комбинацией переменных ошибки по состоянию системы. Очевидно, эта величина является измеряемой, когда она представляет собой линейную комбинацию переменных ошибки по выходу системы: е РВ = (у1 у2) g = е С g для некоторого числа g, что эквивалентно соотношению РВ = С g. Если это соотношение выполнено, то алгоритм адаптации, получаемый по методу скоростного градиента в дифференциальной форме принимает вид
(5.59)
(5.60)
ёі = Yi(Yi У2)Рі(хі, Х2, Т), і =1, ...,N, ?о = Yo(Yi Y2)2,
где Yi, i = 1,...,N - коэффициенты адаптации, величина которых произвольна , а знак совпадает со знаком g.
В более общем случае, если выходы являются I-мерными векторами, то g Е Ш1 и алгоритм адаптации имеет вид
? = -Yig (Yi - У2)?і (хі, Х2, t), і = 1,...,N, (5.61)
А. Т
00 = -Yo[g (Yi - У2ЖУ1 - У2) (5.62)
где Yi 0, i = 1,... ,N.
Для вывода условий работоспособности предложенной схемы понадобятся некоторые определения и результаты из теории управления.
Определение 5.3 [80]. Линейная система X = Ах+Ви, у = Сх с передаточной матрицей W(А) = С(ХІ - А)-1 В, где и, у Е Ш1 и А Е C называется минимально-фазовой если многочлен ^(А) = det(AI -A)det W(А) гурвицев. Система называется гипер-минимально-фа-зовой если она минимально-фазовая и матрица С В = 1ітА^то AW (А) симметрична и положительно определена. ?
Заметим, что для I = 1 система п-го порядка гипер-минималь-нофазовая, если числитель ее передаточной функции - гурвицев многочлен степени п - 1с положительными коэффициентами, что эквивалентно случаю D = 1 в условиях Меерова.