Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.
Для функции
, дважды дифференцируемой в точке
![{\displaystyle H(x)=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}x_{i}x_{j}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/03bb513e90eb78e23f08a468d1d72737379a1e76)
или
![{\displaystyle H(z)=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}z_{i}{\overline {z}}_{j}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b1ba3b86ce034dd4da9962a2c90883ea49928d44)
где
(или
) и функция
задана на
-мерном вещественном пространстве
(или комплексном пространстве
) с координатами
(или
). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы
см. ниже.
Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то
![{\displaystyle H(f)={\begin{bmatrix}{\frac {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac {\partial ^{2}f}{\partial x_{1}\,\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{1}\,\partial x_{n}}}\\\\{\frac {\partial ^{2}f}{\partial x_{2}\,\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{2}\,\partial x_{n}}}\\\\\vdots &\vdots &\ddots &\vdots \\\\{\frac {\partial ^{2}f}{\partial x_{n}\,\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{n}\,\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{n}^{2}}}\end{bmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/389411defb8c9662a366a1d87c25c197c1c56dc4)
Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 4235 дней].
Матрицы Гессе используются в задачах оптимизации методом Ньютона.
Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.
Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:
![{\displaystyle {\frac {\partial }{\partial x_{i}}}\left({\frac {\partial f}{\partial x_{j}}}\right)={\frac {\partial }{\partial x_{j}}}\left({\frac {\partial f}{\partial x_{i}}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/955b6a023defde651d5bd2a2eb4b14551c7d77c9)
Это можно также записать как
![{\displaystyle f_{x_{i}x_{j}}=f_{x_{j}x_{i}},\quad \forall i,j\in \{1,\ldots ,n\}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f1ce5e29e407b8639956fb55dc03034b39309824)
В этом случае матрица Гессе симметрична.
Если градиент
(её векторная производная) равен нулю в некоторой точке
, то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:
- если гессиан положительно определён, то
— точка локального минимума функции
,
- если гессиан отрицательно определён, то
— точка локального максимума функции
,
- если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден
, то
— седловая точка функции
.
Если
— вектор-функция, то есть
![{\displaystyle f=(f_{1},f_{2},\dots ,f_{n}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e382ab27aa503cfc5c765154678f4c3861c1f166)
то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из
матриц Гессе:
![{\displaystyle H(f)=\left(H(f_{1}),\ldots ,H(f_{n})\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/84a45ea8c37345695ba69cce572420d702d0705a)
При
данный тензор вырождается в обычную матрицу Гессе.
При решении задачи нахождения условного экстремума функции
с ограничениями
![{\displaystyle \left\{{\begin{array}{c}g_{1}(x)=0,\\\vdots \\g_{m}(x)=0,\end{array}}\right.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d62cabcc89ab62eb79c49689baf65ff4ed9d21ab)
где
,
, для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа
, который будет иметь вид[2]
![{\displaystyle \left({\begin{array}{cc}{\dfrac {\partial ^{2}L}{\partial x^{2}}}&{\dfrac {\partial ^{2}L}{\partial x\partial \lambda }}\\\left({\dfrac {\partial ^{2}L}{\partial x\partial \lambda }}\right)^{\mathrm {T} }&{\dfrac {\partial ^{2}L}{\partial \lambda ^{2}}}\end{array}}\right)=\left({\begin{array}{cccccc}{\dfrac {\partial ^{2}L}{\partial x_{1}^{2}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{1}\partial x_{n}}}&{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{1}}}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial ^{2}L}{\partial x_{n}\partial x_{1}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{n}^{2}}}&{\dfrac {\partial g_{1}}{\partial x_{n}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{n}}}\\{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{1}}{\partial x_{n}}}&0&\ldots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial g_{m}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{n}}}&0&\ldots &0\end{array}}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/56aa36b2c880c0d2f09271c5132ea2133eb6543e)
Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют
и
такие, что
и
![{\displaystyle (-1)^{m}{\mbox{det}}\left({\begin{array}{cccccc}{\dfrac {\partial ^{2}L}{\partial x_{1}^{2}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{1}\partial x_{p}}}&{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{1}}}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial ^{2}L}{\partial x_{p}\partial x_{1}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{p}^{2}}}&{\dfrac {\partial g_{1}}{\partial x_{p}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}\\{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{1}}{\partial x_{p}}}&0&\ldots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial g_{m}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}&0&\ldots &0\end{array}}\right)>0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8505a7f7019bbe327d03b30d918126ac179b8a3a)
для
, то в точке
функция
имеет строгий условный минимум. Если же
![{\displaystyle (-1)^{p}{\mbox{det}}\left({\begin{array}{cccccc}{\dfrac {\partial ^{2}L}{\partial x_{1}^{2}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{1}\partial x_{p}}}&{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{1}}}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial ^{2}L}{\partial x_{p}\partial x_{1}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{p}^{2}}}&{\dfrac {\partial g_{1}}{\partial x_{p}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}\\{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{1}}{\partial x_{p}}}&0&\ldots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial g_{m}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}&0&\ldots &0\end{array}}\right)>0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9e9e3781a8441a47bd82cffedcff0d2706c7d2c9)
для
, то в точке
функция
имеет строгий условный максимум[3].
Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.
- Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
- Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
- Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.