2. ФУНКЦИИ ОТ МАТРИЦ

Постановка задачи

Пусть А = (аij) – квадратная матрица n-го порядка и f(l) – функция скалярного аргумента. Требуется определить, что следует понимать под f(A), т. е. требуется распространить функцию f(l) на матричные значения аргумента.

Эта задача очень просто решается, если – многочлен, тогда, очевидно, можно положить . Например, если и , то . Как же решить эту задачу в общем случае? Например, что такое или ?

Определение функций от матриц через многочлены

Определение 1: Скалярный многочлен называется аннулирующим многочленом квадратной матрицы А, если . Например, – аннулирующий многочлен матрицы . Действительно, , .

Если – аннулирующий многочлен матрицы А, то есть аннулирующий многочлен матрицы А при любом многочлене . Действительно, .

Определение 2: Аннулирующий многочлен наименьшей степени с единичным старшим коэффициентом называется минимальным многочленом матрицы А.

Определение 3: Характеристическим многочленом (определителем) квадратной матрицы А называется . Характеристическим (вековым) уравнением матрицы А называется уравнение . Корни характеристического уравнения называются характеристическими (собственными) числами матрицы А. Их совокупность называется спектром матрицы.

Теорема 1. (Гамильтона-Кэли). Всякая квадратная матрица удовлетворяет своему характеристическому уравнению, т. е. .

Отсюда следует, что всякая квадратная матрица имеет аннулирующие многочлены (в частности, таковым является характеристический многочлен).

Теорема 2. Произвольный аннулирующий многочлен матрицы делится без остатка на ее минимальный многочлен.

Теорема 3. Минимальный многочлен существует и единственен для любой квадратной матрицы.

Теорема 4. Корнями минимального многочлена служат все характеристические числа матрицы А.

Таким образом, если , где при и , то минимальным многочленом является , где .

Теорема 5. Пусть – наибольший общий делитель всех миноров порядка n-1 характеристической матрицы , тогда минимальный многочлен .

Пример 1. Найти минимальный многочлен матрицы .

Решение. Характеристическая матрица:;

; миноры порядка n-1=2-1=1: , , , , их наибольший общий делитель . Отсюда .

Пример 2. Найти минимальный многочлен матрицы .

Первый способ. ; ;

миноры порядка n-1=3-1=2: ,

, ,

, .

Их наибольший общий делитель: . Поэтому

Второй способ. . По теореме 4 минимальным многочленом может быть один из многочленов или . Следует проверить, какие из этих двух многочленов являются аннулирующими (второй тривиально является), и выбрать из них многочлен минимальной степени. Таким образом, следует проверить, является ли аннулирующим:

Ттаким образом, , как и в первом способе решения.

Пусть

– (П.15)

минимальный многочлен матрицы А. Степень этого многочлена есть m=m1+…+mk. Пусть и – такие многочлены, что

. (П.16)

Тогда разность есть аннулирующий многочлен матрицы А, поэтому делится на без остатка, т. е.

= (mod ). (П.17)

Отсюда и из (П.15) следует . Следовательно,

, , , . (П.18)

Пусть – некоторая функция, а –минимальный многочлен матрицы А. Совокупность из m чисел

, , …, , (П.19)

называется значениями функции на спектре матрицы А и обозначается . Если все значения (П.19) существуют, то говорят, что функция определена на спектре матрицы А.

Пример 3. Если , то для определенности на спектре должны существовать , и . Например, фкнкция не определена, а функции и определены на спетре матрицы.

Равенства (П.18) означают, что многочлены и имеют одни и те же значения на спектре матрицы А, что будем записывать в виде . И наоборот, из (П.18) следует (П.17) и (П.16).

Таким образом, если задана матрица А, то значения многочлена на ее спектре полностью определяют значение , т. е. все многочлены , принимающие одни и те же значения на спектре матрицы А, имеют одно и то же значение . Поэтому естественно потребовать, чтобы определение подчинялось этому принципу: значения на спектре матрицы А должны полностью определять значения , т. е. все функции , совпадающие на спектре матрицы А, должны иметь одно и то же значение . Если исходить из этого принципа, то в общем случае достаточно для определения найти любой многочлен , совпадающий с на спектре матрицы А, и положить=. Таким образом, приходим к следующему определению.

Определение 4. Если функция определена на спектре матрицы А и – любой многочлен, совпадающий с на спектре матрицы А (т. е. ), то, по определению,

=. (П.20)

Такой многочлен можно получить, используя различные методы интерполяции или метод неопределенных коэффициентов. Среди таких многочленов существует единственный, имеющий степень, меньшую m. Таким образом, выражается через Е, А, А2, …,Аm-1 с некоторыми скалярными коэффициентами:

. (П.21)

Если использовать метод неопределенных коэффициентов, то, полагая , получим для нахождения коэффициентов а0,…,аm-1 систему из m линейных уравнений:

, , . (П.22)

Пример 4. Возьмем матрицу из примера 1: , ее минимальный многочлен есть . Следовательно, для определения достаточно найти любой многочлен такой, что = и =.

а) Пусть . Тогда можно взять . Отсюда . И вообще, если – многочлен, то решение тривиально.

б) Пусть , т. е. будем искать =А-1 – обратную матрицу. Функция определена на спектре матрицы А, поэтому для определения достаточно найти любой многочлен такой, что ==1/2 и ==1/7. Возьмем , тогда , , , . Следовательно,

Проверка: .

Вместо многочлена можно найти другой подходящий многочлен. Возьмем, например, , тогда для нахождения его коэффициентоф имеем систему уравнений , решение которой есть . Отсюда и

–

результат тот же.

в) Вычислить .

г) Вычислить eА и 2А.

д) Вычислить Аn.

е) Выразить в общем случае через и . Ответ для этого варианта: .

Определение функций от матриц через компоненты матрицы

Недостатком определения , сделанного в предыдущем параграфе, является необходимость сложного вычисления коэффициентов в (П.21) для каждой функции , что очень неудобно, если нужно вычислить для множества различных функций . Получим другое определение , свободное от этого недостатка.

Из линейности уравнений системы (П.22) следует, что коэффициенты а0,а1,…,аm-1 в (П.21) линейно зависят от значений , т. е.

. (П.23)

Группируя (П.23) относительно , получим другую формулу:

, (П.24)

где m матриц определяются заданием матрицы А и не зависят от выбора функции .

Определение 4. Матрицы из (П.24) называются составляющими матрицами матрицы А или ее компонентами. Формула (П.24) считается основной формулой для определения .

Теорема 6. Компоненты матрицы линейно независимы между собой и перестановочны между собой и с матрицей А.

Для нахождения компонент матрица А можно выполнить группировку (П.23)®( П.24) или же использовать (П.24) для нескольких функций .

Пример 5. Рассмотрим снова матрицу А из примеров 1 и 4 и выразим через компоненты матрицы А.

Первый способ. Представим в виде (П.24), т. е.

. (П.25)

Используя решение примера 4е, имеем

, т. е.

Таким образом, для любой функции , определенной при l=2 и l=7, имеем

Проверьте полученный результат для функций , , .

Вычислите , Аn, (А-Е)n.

Второй способ. Положим в (1.11) , тогда , и , отсюда . Аналогично, при имеем , , . Таким образом, имеем систему уравнений , откуда , что совпадает с решением первым способом.

Пример 6. Выразить через компоненты матрицы

Представление функций от матриц рядами

В теории степенных рядов рассматривается представление скалярных функций в виде

. (П.26)

Все члены ряда в правой части (П.26) будут определены, если скалярный аргумент заменить на матричный. Поэтому представляется естественным определить функцию от матрицы с помощью степенного ряда, т. е. положить

. (П.27)

Однако при этом возникают вопросы сходимости ряда в (П.27) к , т. е. частичные суммы должны иметь своим пределом :

Теорема 7. Если функция разлагается в степенной ряд (П.26) в круге на комплексной плоскости, то это разложение выполняется (имеет место (П.27)) и для любой матрицы А, все характеристические числа которой лежат внутри этого круга сходимости, т. е. если , .

Из этой теоремы и известных разложений следуют формулы:

, , ,

(,),

(,).

Интегральное представление функций от матриц

В теории функций комплексного переменного известна интегральная формула Коши

где – аналитическая функция внутри контура Г; z – комплексный аргумент; l – точка внутри контура Г.

Оказывается, что эту формулу можно распространить и на матричные аргументы:

(П.28)

при условии, что характеристические числа матрицы А находятся внутри Г.

Некоторые свойства функций от матриц

1. Все приведенные выше определения функций от матриц эквивалентны в том смысле, что они определяют одно и то же значение .

2. Для диагональных матриц имеем .

3. Пусть , где функции определены на спектре матрицы А, а функция может содержать действия сложения, умножения, умножения на число и замены величины на произвольную функцию от нее (суперпозиция). Тогда из следует .

Например, пусть А – неособенная матрица (). Тогда в скалярном тождестве можно заменить l на А: .

Свойство 3 не очень строго можно сформулировать следующим образом. При выполнении не очень сильных ограничений соотношения между функциями скалярного аргумента сохраняют силу при переходе к матричному аргументу. Например: , и т.д.

Пример 7. Рассмотрим дифференциальное уравнение

(П.29)

с начальным условием . Его решение имеет вид

. (П.30)

Рассмотрим теперь систему уравнений

(П.31)

с начальными условиями , что можно записать в матричном виде как

(П.32)

с начальным условием , где , , .

Уравнение (П.32) получается из (П.29) заменой скалярного аргумента на матричный. Применяя функции от матриц, можно показать, что и решение уравнения (П.32) имеет вид, аналогичный решению (П.30): .

Функции от матриц вида H(a,b)

Рассмотрим квадратные матрицы m-го порядка вида

, (П.33)

где a и b – действительные числа; E – единичная матрица; I – матрица, состоящая из единиц. Определим функции от матриц этого вида, предполагая . Если , то это случай неинтересный.

Найдем сначала характеристический определитель матрицы H(a,b):

Сумма всех строк есть строка (l-a-mb, l-a-mb, …, l-a-mb), которая превращается в нулевую строку при l=a+mb. Следовательно, l1=a+mb – корень характеристического определителя. Далее, при l=a характеристический определитель превращается в определитель из одинаковых строк (-b, -b, …, -b), он равен нулю, поэтому l=a – тоже корень. Найдем производные от . Производная от определителя есть сумма определителей, в каждом из которых взята производная всех элементов одной из строк:

т. е. и . Вторая производная: и и так далее. Наконец, последние производные: и ; и ; . Таким образом, , следовательно, l=a является корнем кратности m-1. Итак, , т. е. характеристические числа матрицы H(a,b) есть l1=a+mb, l2=a, …, lm=a.