Теоретическая часть
Пусть система описывается векторным дифференциальным уравнением с переменными коэффициентами:
- матрица коэффициентов объекта управления, коэффициенты зависят от времени;
- прямоугольная матрица распределения управляющих воздействий. Коэффициенты этой матрицы также зависят от времени.
Необходимо перевести систему из некоторого начального состояния x(t0) в заданное конечное состояние
x(tk) ≅0, (2)
используя допустимые функции управления и не выходя за допустимые пределы по фазовым переменным в процессе движения.
Один из методов решения этой задачи состоит в минимизации критерия качества, представляющего собой сумму квадратичной формы от вектора конечного состояния и интеграла от суммы квадратичных форм вектора состояния и вектора управления
Здесь Gk и Q(t) - положительно полуопределенные матрицы, R(t) - положительно определенная матрица.
Управление , минимизирующее (3), можно найти путем совместного решения уравнения (1) и уравнения Эйлера-Лагранжа
где гамильтониан
откуда
.
Подстановка (7) в (1) приводит к следующей линейной краевой задаче:
Результатом решения двухточечной краевой задачи (8), (9) является программное управление
где симметричная матрица S(t) определяется из матричного уравнения Риккати
при граничном условии S(tk) = Gk, а и связаны линейным преобразованием
Вектор можно найти из уравнения
Для задачи терминального управления основной интерес представляет сам непрерывный закон управления с обратной связью
.
Выбор постоянных весовых коэффициентов
Закон управления и реакция системы в значительной степени зависят от выбора весовых коэффициентов показателя качества. Взаимосвязь весовых коэффициентов и параметров оптимальной системы или ее реакцией в общем случае очень сложная.
Для получения допустимых уровней величин , и матрицы Gk, Q(t) и R(t) могут быть выбраны, например, диагональными со следующими элементами:
Для стационарных систем метод выбора коэффициентов функционала предложен Эллертом.
Для объекта второго порядка, описываемого уравнением
с показателем качества
где tk=∞, а матрицы Q и R имеют вид
закон управления имеет вид
в котором коэффициенты определяются из решения системы нелинейных алгебраических уравнений (11) Риккати
а вектор определяется из уравнения (13)
Так как замкнутая система линейная стационарная, то ее передаточная функция определяется как
Согласно процедуре Эллерта выбор коэффициента “демпфирования” ζ обеспечивает требуемую степень устойчивости системы при условии, что ни одна из переменных системы не превышает заданных пределов.
Постоянная времени T выбирается в соответствии с требуемой полосой пропускания системы или ограничениями на u2(t) из уравнения
при подстановке в него максимально допустимой величины u2(t), “наихудших” x1(t), x2(t) и v1(t), предварительно разрешив уравнения (22) относительно .
После определения ζ и T весовые коэффициенты q11 и q22 задаются уравнениями
Для выпуклости функционала качества весовые коэффициенты q11 и q22 должны быть неотрицательными. В сущности, это требование служит проверкой непротиворечивости требований проектирования в предположении правомерности выбора квадратичного показателя качества с постоянными весовыми коэффициентами.
После определения этих величин предположение о бесконечном tk отбрасывается (это является слабым местом методики Эллерта) и рассчитывается оптимальная система для заданного tk.
Для объектов, описываемых уравнениями более высокого порядка, уравнение (23) принимает вид
соответственно для систем первого, второго и третьего типа, то есть систем соответственно с нулевой установившейся ошибкой при единичном ступенчатом входном сигнале, единичном линейно нарастающем входном сигнале и т.д.
Практическая часть
Исходные данные:
ü Коэффициент обратной связи
ü Постоянная времени
ü
Структурная схема исследуемой системы иммет вид:
Согласно исходным данным, передаточная функция имеет вид:
При переходе в пространство состояний имеем:
> W=[tf([16],[0.01 0.08 1]) tf([16],[0.01 0.08 1])]
Transfer function from input 1 to output:
---------------------
0.01 s^2 + 0.08 s + 1
Transfer function from input 2 to output:
---------------------
0.01 s^2 + 0.08 s + 1
>> [A,B,C,D]=SSDATA(W)
A = // матрица системы
0 -12.5000
8.0000 -8.0000
B = // матрица управления
0 0
0 8.0000
C = // матрица выхода (наблюдения)
1.0000 0
0 12.5000
Q = // матрица весовых коэффициентов
4.5903 0
0 0.0000
Для исходной системы ЛАЧХ имеют вид:
Переходной процесс исследуемой системы:
Матрицу R вычислим по методу Брайсона и Хо Ю-ши:
для
Матрицу коэффициентов обратной связи найдем с помощью подпрограммы lqr (пакетMatLAB)
[K,S,E]=lqr(A,B,Q,R)
sys1=ss(A,B,eye(2),D);
sys2=ss(K);
sys3=ss(C);
Pss1=feedback(sys1,sys2);
Pss1=series(Pss1,sys3);
[A1,B1,C1,D1] = ssdata(Pss1);
С учетом всего выше изложенного график оптимального управления имеет вид:
Далее используем подпрограмму feedback, для того, чтобы сформировать замкнутую систему управления и построить переходной процесс оптимальной системы.