Экспонента матрицы — матричная функция от квадратной матрицы , аналогичная обычной экспоненциальной функции . Матричная экспонента устанавливает связь между алгеброй Ли матриц и соответствующий группой Ли .
Для вещественной или комплексной матрицы
X
{\displaystyle X}
размера
n
×
n
{\displaystyle n\times n}
экспонента от
X
{\displaystyle X}
, обозначаемая как
e
X
{\displaystyle e^{X}}
или
exp
(
X
)
{\displaystyle \exp(X)}
, — это матрица
n
×
n
{\displaystyle n\times n}
, определяемая степенным рядом :
e
X
=
∑
k
=
0
∞
1
k
!
X
k
{\displaystyle e^{X}=\sum _{k=0}^{\infty }{1 \over k!}X^{k}}
,
где
X
k
{\displaystyle X^{k}}
— k -я степень матрицы
X
{\displaystyle X}
.
Данный ряд всегда сходится, так что экспонента от
X
{\displaystyle X}
всегда корректно определена.
Если
X
{\displaystyle X}
— матрица размера
1
×
1
{\displaystyle 1\times 1}
, то матричная экспонента от
X
{\displaystyle X}
есть матрица размерности
1
×
1
{\displaystyle 1\times 1}
, единственный элемент которой равен обычной экспоненте от единственного элемента
X
{\displaystyle X}
.
Для комплексных матриц
X
{\displaystyle X}
и
Y
{\displaystyle Y}
размера
n
×
n
{\displaystyle n\times n}
, произвольных комплексных чисел
a
{\displaystyle a}
и
b
{\displaystyle b}
, единичной матрицы
E
{\displaystyle E}
и нулевой матрицы
0
{\displaystyle 0}
, экспонента обладает следующим свойствами:
exp
0
=
E
{\displaystyle \exp 0=E}
;
exp
a
X
exp
b
X
=
exp
(
(
a
+
b
)
X
)
{\displaystyle \exp aX\exp bX=\exp \left((a+b)X\right)}
;
exp
X
exp
(
−
X
)
=
E
{\displaystyle \exp X\exp \left(-X\right)=E}
;
если
X
Y
=
Y
X
{\displaystyle XY=YX}
, то
exp
X
exp
Y
=
exp
Y
exp
X
=
exp
(
X
+
Y
)
{\displaystyle \exp X\exp Y=\exp Y\exp X=\exp(X+Y)}
;
если
Y
{\displaystyle Y}
— невырожденная матрица , то
exp
(
Y
X
Y
−
1
)
=
Y
exp
(
X
)
Y
−
1
{\displaystyle \exp(YXY^{-1})=Y\exp(X)Y^{-1}}
.
exp
X
T
=
(
exp
X
)
T
{\displaystyle \exp X^{\mathrm {T} }=(\exp X)^{\mathrm {T} }}
, где
X
T
{\displaystyle X^{\mathrm {T} }}
обозначает транспонированную матрицу для
X
{\displaystyle X}
, отсюда следует, что если
X
{\displaystyle X}
является симметричной , то
exp
X
{\displaystyle \exp X}
тоже симметрична, а если
X
{\displaystyle X}
— кососимметричная матрица , то
exp
X
{\displaystyle \exp X}
— ортогональная ;
exp
(
X
∗
)
=
(
exp
X
)
∗
{\displaystyle \exp(X^{*})=(\exp X)^{*}}
, где
X
∗
{\displaystyle X^{*}}
обозначает эрмитово-сопряжённую матрицу для
X
{\displaystyle X}
, отсюда следует, что если
X
{\displaystyle X}
— эрмитова матрица , то
exp
X
{\displaystyle \exp X}
тоже эрмитова, а если
X
{\displaystyle X}
— антиэрмитова матрица , то
exp
X
{\displaystyle \exp X}
— унитарная
det
(
exp
X
)
=
exp
(
tr
X
)
{\displaystyle \det(\exp X)=\exp(\operatorname {tr} X)}
, где
tr
X
{\displaystyle \operatorname {tr} X}
— след матрицы
X
{\displaystyle X}
.
Одна из причин, обуславливающих важность матричной экспоненты, заключается в том, что она может быть использована для решения систем обыкновенных дифференциальных уравнений [ 1] . Решение системы:
d
d
t
y
(
t
)
=
A
y
(
t
)
,
y
(
0
)
=
y
0
{\displaystyle {\frac {d}{dt}}y(t)=Ay(t),\quad y(0)=y_{0}}
,
где
A
{\displaystyle A}
— постоянная матрица, даётся выражением:
y
(
t
)
=
e
A
t
y
0
.
{\displaystyle y(t)=e^{At}y_{0}.}
Матричная экспонента может быть также использована для решения неоднородных уравнений вида
d
d
t
y
(
t
)
=
A
y
(
t
)
+
z
(
t
)
,
y
(
0
)
=
y
0
{\displaystyle {\frac {d}{dt}}y(t)=Ay(t)+z(t),\quad y(0)=y_{0}}
.
Не существует замкнутого аналитического выражения для решений неавтономных дифференциальных уравнений вида
d
d
t
y
(
t
)
=
A
(
t
)
y
(
t
)
,
y
(
0
)
=
y
0
{\displaystyle {\frac {d}{dt}}y(t)=A(t)\,y(t),\quad y(0)=y_{0}}
,
где
A
{\displaystyle A}
— не постоянная, но разложение Магнуса [англ.] позволяет получить представление решения в виде бесконечной суммы.
Для любых двух вещественных чисел (скаляров)
x
{\displaystyle x}
и
y
{\displaystyle y}
экспоненциальная функция удовлетворяет уравнению
e
x
+
y
=
e
x
⋅
e
y
{\displaystyle e^{x+y}=e^{x}\cdot e^{y}}
, это же свойство имеет место для симметричных матриц — если матрицы
X
{\displaystyle X}
и
Y
{\displaystyle Y}
коммутируют (то есть
X
Y
=
Y
X
{\displaystyle XY=YX}
), то
exp
(
X
+
Y
)
=
exp
(
X
)
exp
(
Y
)
{\displaystyle \exp(X+Y)=\exp(X)\exp(Y)}
. Однако для некоммутирующих матриц это равенство выполняется не всегда, в общем случае для вычисления
exp
(
X
+
Y
)
{\displaystyle \exp(X+Y)}
используется формула Бейкера — Кэмпбелла — Хаусдорфа .
В общем случае из равенства
exp
(
X
+
Y
)
=
exp
(
X
)
exp
(
Y
)
{\displaystyle \exp(X+Y)=\exp(X)\exp(Y)}
не следует, что
X
{\displaystyle X}
и
Y
{\displaystyle Y}
коммутируют.
Для эрмитовых матриц существует две примечательные теоремы, связанные со следом экспонент матриц.
Если
A
{\displaystyle A}
и
H
{\displaystyle H}
— эрмитовы матрицы, то[ 2] :
tr
exp
(
A
+
H
)
⩽
tr
(
exp
(
A
)
exp
(
H
)
)
{\displaystyle \operatorname {tr} \exp(A+H)\leqslant \operatorname {tr} (\exp(A)\exp(H))}
,
Коммутативность для выполнения данного утверждения не требуется. Существуют контрпримеры, которые показывают, что неравенство Голдена — Томпсона не может быть расширено на три матрицы, а
tr
(
exp
(
A
)
exp
(
B
)
exp
(
C
)
)
{\displaystyle \operatorname {tr} (\exp(A)\exp(B)\exp(C))}
не всегда является вещественным числом для эрмитовых матриц
A
{\displaystyle A}
,
B
{\displaystyle B}
и
C
{\displaystyle C}
.
Теорема Либа, названная по имени Эллиотта Либа [англ.] , гласит, что для фиксированной эрмитовой матрицы
H
{\displaystyle H}
, функция:
f
(
A
)
=
tr
exp
(
H
+
log
A
)
{\displaystyle f(A)=\operatorname {tr} \,\exp \left(H+\log A\right)}
является вогнутой на конусе положительно-определённых матриц [ 3] .
Экспонента матрицы всегда является невырожденной матрицей . Обратная к
exp
X
{\displaystyle \exp X}
матрица равна
exp
(
−
X
)
{\displaystyle \exp(-X)}
, это аналог того факта, что экспонента от комплексного числа никогда не равна нулю. Таким образом, матричная экспонента определяет отображение:
exp
:
M
n
(
C
)
→
G
L
(
n
,
C
)
{\displaystyle \exp \colon M_{n}(\mathbb {C} )\to \mathrm {GL} (n,\mathbb {C} )}
из пространства всех матриц размерности
n
×
n
{\displaystyle n\times n}
на полную линейную группу порядка
n
{\displaystyle n}
, то есть группу всех невырожденных матриц размерности
n
×
n
{\displaystyle n\times n}
. Это отображение является сюръекцией , то есть каждая невырожденная матрица может быть записана как экспонента от некоторой другой матрицы (чтобы это имело место необходимо рассматривать поле комплексных чисел
C
{\displaystyle \mathbb {C} }
, а не вещественных чисел
R
{\displaystyle \mathbb {R} }
).
Для любых двух матриц
X
{\displaystyle X}
и
Y
{\displaystyle Y}
имеет место неравенство
‖
e
X
+
Y
−
e
X
‖
⩽
‖
Y
‖
e
‖
X
‖
e
‖
Y
‖
{\displaystyle \|e^{X+Y}-e^{X}\|\leqslant \|Y\|e^{\|X\|}e^{\|Y\|}}
,
где
‖
⋅
‖
{\displaystyle \|\cdot \|}
обозначает произвольную матричную норму . Отсюда следует, что экспоненциальное отображение является непрерывным и липшицевым на компактных подмножествах
M
n
(
C
)
{\displaystyle M_{n}(\mathbb {C} )}
.
Отображение:
t
↦
e
t
X
,
t
∈
R
{\displaystyle t\mapsto e^{tX},\qquad t\in \mathbb {R} }
определяет гладкую кривую в полной линейной группе, которая проходит через единичный элемент при
t
=
0
{\displaystyle t=0}
.
Для системы:
x
′
=
2
x
−
y
+
z
y
′
=
3
y
−
1
z
z
′
=
2
x
+
y
+
3
z
.
{\displaystyle {\begin{matrix}x'&=&2x&-y&+z\\y'&=&&3y&-1z\\z'&=&2x&+y&+3z~.\end{matrix}}}
её матрица есть:
A
=
[
2
−
1
1
0
3
−
1
2
1
3
]
.
{\displaystyle A={\begin{bmatrix}2&-1&1\\0&3&-1\\2&1&3\end{bmatrix}}~.}
Можно показать, что экспонента от матрицы
t
A
{\displaystyle tA}
есть
e
t
A
=
1
2
[
e
2
t
(
1
+
e
2
t
−
2
t
)
−
2
t
e
2
t
e
2
t
(
−
1
+
e
2
t
)
−
e
2
t
(
−
1
+
e
2
t
−
2
t
)
2
(
t
+
1
)
e
2
t
−
e
2
t
(
−
1
+
e
2
t
)
e
2
t
(
−
1
+
e
2
t
+
2
t
)
2
t
e
2
t
e
2
t
(
1
+
e
2
t
)
]
,
{\displaystyle e^{tA}={\frac {1}{2}}{\begin{bmatrix}e^{2t}(1+e^{2t}-2t)&-2te^{2t}&e^{2t}(-1+e^{2t})\\-e^{2t}(-1+e^{2t}-2t)&2(t+1)e^{2t}&-e^{2t}(-1+e^{2t})\\e^{2t}(-1+e^{2t}+2t)&2te^{2t}&e^{2t}(1+e^{2t})\end{bmatrix}}~,}
таким образом, общее решение этой системы есть:
[
x
y
z
]
=
x
(
0
)
2
[
e
2
t
(
1
+
e
2
t
−
2
t
)
−
e
2
t
(
−
1
+
e
2
t
−
2
t
)
e
2
t
(
−
1
+
e
2
t
+
2
t
)
]
+
y
(
0
)
2
[
−
2
t
e
2
t
2
(
t
+
1
)
e
2
t
2
t
e
2
t
]
+
z
(
0
)
2
[
e
2
t
(
−
1
+
e
2
t
)
−
e
2
t
(
−
1
+
e
2
t
)
e
2
t
(
1
+
e
2
t
)
]
.
{\displaystyle {\begin{bmatrix}x\\y\\z\end{bmatrix}}={\frac {x(0)}{2}}{\begin{bmatrix}e^{2t}(1+e^{2t}-2t)\\-e^{2t}(-1+e^{2t}-2t)\\e^{2t}(-1+e^{2t}+2t)\end{bmatrix}}+{\frac {y(0)}{2}}{\begin{bmatrix}-2te^{2t}\\2(t+1)e^{2t}\\2te^{2t}\end{bmatrix}}+{\frac {z(0)}{2}}{\begin{bmatrix}e^{2t}(-1+e^{2t})\\-e^{2t}(-1+e^{2t})\\e^{2t}(1+e^{2t})\end{bmatrix}}~.}
Для решения неоднородной системы:
x
′
=
2
x
−
y
+
z
+
e
2
t
y
′
=
3
y
−
z
z
′
=
2
x
+
y
+
3
z
+
e
2
t
{\displaystyle {\begin{matrix}x'&=&2x&-&y&+&z&+&e^{2t}\\y'&=&&&3y&-&z&\\z'&=&2x&+&y&+&3z&+&e^{2t}\end{matrix}}}
вводятся обозначения:
A
=
[
2
−
1
1
0
3
−
1
2
1
3
]
,
{\displaystyle A=\left[{\begin{array}{rrr}2&-1&1\\0&3&-1\\2&1&3\end{array}}\right]~,}
и
b
=
e
2
t
[
1
0
1
]
{\displaystyle \mathbf {b} =e^{2t}{\begin{bmatrix}1\\0\\1\end{bmatrix}}}
Так как сумма общего решения однородного уравнения и частного решения дают общее решение неоднородного уравнения, остаётся лишь найти частное решение. Так как:
y
p
=
e
t
A
∫
0
t
e
(
−
u
)
A
[
e
2
u
0
e
2
u
]
d
u
+
e
t
A
c
{\displaystyle \mathbf {y} _{p}=e^{tA}\int _{0}^{t}e^{(-u)A}{\begin{bmatrix}e^{2u}\\0\\e^{2u}\end{bmatrix}}\,du+e^{tA}\mathbf {c} }
y
p
=
e
t
A
∫
0
t
[
2
e
u
−
2
u
e
2
u
−
2
u
e
2
u
0
−
2
e
u
+
2
(
u
+
1
)
e
2
u
2
(
u
+
1
)
e
2
u
0
2
u
e
2
u
2
u
e
2
u
2
e
u
]
[
e
2
u
0
e
2
u
]
d
u
+
e
t
A
c
{\displaystyle \mathbf {y} _{p}=e^{tA}\int _{0}^{t}{\begin{bmatrix}2e^{u}-2ue^{2u}&-2ue^{2u}&0\\\\-2e^{u}+2(u+1)e^{2u}&2(u+1)e^{2u}&0\\\\2ue^{2u}&2ue^{2u}&2e^{u}\end{bmatrix}}{\begin{bmatrix}e^{2u}\\0\\e^{2u}\end{bmatrix}}\,du+e^{tA}\mathbf {c} }
y
p
=
e
t
A
∫
0
t
[
e
2
u
(
2
e
u
−
2
u
e
2
u
)
e
2
u
(
−
2
e
u
+
2
(
1
+
u
)
e
2
u
)
2
e
3
u
+
2
u
e
4
u
]
d
u
+
e
t
A
c
{\displaystyle \mathbf {y} _{p}=e^{tA}\int _{0}^{t}{\begin{bmatrix}e^{2u}(2e^{u}-2ue^{2u})\\\\e^{2u}(-2e^{u}+2(1+u)e^{2u})\\\\2e^{3u}+2ue^{4u}\end{bmatrix}}\,du+e^{tA}\mathbf {c} }
y
p
=
e
t
A
[
−
1
24
e
3
t
(
3
e
t
(
4
t
−
1
)
−
16
)
1
24
e
3
t
(
3
e
t
(
4
t
+
4
)
−
16
)
1
24
e
3
t
(
3
e
t
(
4
t
−
1
)
−
16
)
]
+
[
2
e
t
−
2
t
e
2
t
−
2
t
e
2
t
0
−
2
e
t
+
2
(
t
+
1
)
e
2
t
2
(
t
+
1
)
e
2
t
0
2
t
e
2
t
2
t
e
2
t
2
e
t
]
[
c
1
c
2
c
3
]
,
{\displaystyle \mathbf {y} _{p}=e^{tA}{\begin{bmatrix}-{1 \over 24}e^{3t}(3e^{t}(4t-1)-16)\\\\{1 \over 24}e^{3t}(3e^{t}(4t+4)-16)\\\\{1 \over 24}e^{3t}(3e^{t}(4t-1)-16)\end{bmatrix}}+{\begin{bmatrix}2e^{t}-2te^{2t}&-2te^{2t}&0\\\\-2e^{t}+2(t+1)e^{2t}&2(t+1)e^{2t}&0\\\\2te^{2t}&2te^{2t}&2e^{t}\end{bmatrix}}{\begin{bmatrix}c_{1}\\c_{2}\\c_{3}\end{bmatrix}}~,}
где
c
=
y
p
(
0
)
{\displaystyle \mathbf {c} =\mathbf {y} _{p}(0)}
— начальное условие.
В случае неоднородной системы можно использовать метод вариации произвольной постоянной. Ищется частное решение в виде:
y
p
(
t
)
=
exp
(
t
A
)
z
(
t
)
{\displaystyle \mathbf {y} _{p}(t)=\exp(tA)\mathbf {z} (t)}
:
y
p
′
(
t
)
=
(
e
t
A
)
′
z
(
t
)
+
e
t
A
z
′
(
t
)
=
A
e
t
A
z
(
t
)
+
e
t
A
z
′
(
t
)
=
A
y
p
(
t
)
+
e
t
A
z
′
(
t
)
.
{\displaystyle {\begin{aligned}\mathbf {y} _{p}'(t)&=(e^{tA})'\mathbf {z} (t)+e^{tA}\mathbf {z} '(t)\\[6pt]&=Ae^{tA}\mathbf {z} (t)+e^{tA}\mathbf {z} '(t)\\[6pt]&=A\mathbf {y} _{p}(t)+e^{tA}\mathbf {z} '(t)~.\end{aligned}}}
Чтобы
y
p
{\displaystyle \mathbf {y} _{p}}
было решением, должно иметь место следующее:
e
t
A
z
′
(
t
)
=
b
(
t
)
z
′
(
t
)
=
(
e
t
A
)
−
1
b
(
t
)
z
(
t
)
=
∫
0
t
e
−
u
A
b
(
u
)
d
u
+
c
.
{\displaystyle {\begin{aligned}e^{tA}\mathbf {z} '(t)&=\mathbf {b} (t)\\[6pt]\mathbf {z} '(t)&=(e^{tA})^{-1}\mathbf {b} (t)\\[6pt]\mathbf {z} (t)&=\int _{0}^{t}e^{-uA}\mathbf {b} (u)\,du+\mathbf {c} ~.\end{aligned}}}
Таким образом:
y
p
(
t
)
=
e
t
A
∫
0
t
e
−
u
A
b
(
u
)
d
u
+
e
t
A
c
=
∫
0
t
e
(
t
−
u
)
A
b
(
u
)
d
u
+
e
t
A
c
,
{\displaystyle {\begin{aligned}\mathbf {y} _{p}(t)&{}=e^{tA}\int _{0}^{t}e^{-uA}\mathbf {b} (u)\,du+e^{tA}\mathbf {c} \\&{}=\int _{0}^{t}e^{(t-u)A}\mathbf {b} (u)\,du+e^{tA}\mathbf {c} \end{aligned}}~,}
где
c
{\displaystyle \mathbf {c} }
определяется из начальных условий задачи.
↑ Пискунов H. С. Дифференциальное и интегральное исчисления для втузов, т. 2.: Учебное пособие для втузов. — 13-е изд.. — М. : Наука, Главная редакция физико-математической литературы, 1985. — С. 544—547. — 560 с.
↑ Bhatia, R. Matrix Analysis (неопр.) . — Springer, 1997. — Т. 169. — (Graduate Texts in Mathematics). — ISBN 978-0-387-94846-1 .
↑ E. H. Lieb. Convex trace functions and the Wigner–Yanase–Dyson conjecture (англ.) // Adv. Math. : journal. — 1973. — Vol. 11 , no. 3 . — P. 267—288 . — doi :10.1016/0001-8708(73)90011-X .