ГЛАВА VIII. МАТРИЧНЫЕ УРАВНЕНИЯ
В этой главе мы рассмотрим некоторые типы матричных уравнений, встречающиеся в разнообразных вопросах теории матриц и ее приложений.
§ 1. Уравнение AX=XB
Пусть дано уравнение
, (1)
где
и
– две заданные квадратные матрицы (вообще говоря, разных порядков)
,
а
– искомая прямоугольная матрица размером
:
.
Выпишем элементарные делители матриц
и
(в поле комплексных чисел):
.
В соответствии с этими элементарными делителями приведем матрицы
и
к нормальной жордановой форме
, (2)
где
и
– квадратные неособенные матрицы соответственно порядка
и
, а
и
– жордановы матрицы:
(3)
Подставляя в уравнение (1) вместо
и
их выражения (2), получим:
.
Умножим обе части этого равенства слева на
, а справа – на
:
. (4)
Вводя вместо искомой матрицы
новую искомую матрицу
(тех же размеров
)
, (5)
мы уравнение (4) запишем так:
. (6)
Мы заменили матричное уравнение (1) уравнением (6) того же вида, но в котором заданные матрицы имеют нормальную жорданову форму.
В соответствии с квазидиагональным видом матриц
и
разобьем матрицу
на блоки:

(здесь
– прямоугольная матрица размером
).
Используя правило умножения блочной матрицы на квазидиагональную (см. стр. 56), произведем умножение матриц в левой и правой частях уравнения (6). Тогда это уравнение распадается на
матричных уравнений
,
которые перепишем еще так:
; (7)
при этом мы ввели сокращенные обозначения
. (8)
Возьмем какое-нибудь из уравнений (7). Могут представиться два случая:
1.
. Проитерируем
раз равенство (7):
. (9)
Заметим, что в силу (8)
. (10)
Если в (9) взять
, то в каждом члене суммы, стоящей в правой части равенства (9), выполняется по крайней мере одно из соотношений
,
и потому в силу (10) либо
, либо
. Так как, кроме того, в рассматриваемом случае
, то из (9) находим:
. (11)
2.
. В этом случае уравнение (7) принимает вид
. (12)
В матрицах
и
элементы первой наддиагонали равны единице, а все остальные элементы равны нулю. Учитывая эту специфичную структуру матриц
и
и полагая
,
мы заменим матричное уравнение (12) следующей эквивалентной ему системой скалярных соотношении:
. (13)
Равенства (13) означают:
1) В матрице
на каждой линии, параллельной главной диагонали, стоят равные между собой элементы,
2)
.
Пусть
. В этом случае
– квадратная матрица. Из 1), 2) следует, что в матрице
все элементы, расположенные под главной диагональю, равны нулю, все элементы главной диагонали равны некоторому числу
, все элементы первой наддиагонали равны некоторому числу
и т. д., т. е.
; (14)

здесь
– произвольные параметры (уравнения (12) не накладывают никаких ограничений на значения этих параметров).
Легко видеть, что при 
, (15)
а при 
. (16)
Про матрицы (14), (15) и (16) мы будем говорить, что они имеют правильную верхнюю треугольную форму. Число произвольных параметров в
равно наименьшему из чисел
и
. Приведенная ниже схема показывает структуру матрицы
при
(произвольные параметры здесь обозначены через
):

Для того чтобы при подсчете произвольных параметров в матрице
охватить и случай 1, обозначим через
наибольший общий делитель элементарных делителей
и
, а через
– степень многочлена
. В случае 1
; в случае 2 имеем:
. Таким образом, в обоих случаях число произвольных параметров в
равно
. Число произвольных параметров в
определяется формулой
.
В дальнейшем нам удобно будет общее решение уравнения (6) обозначить через
(до сих пор мы это решение обозначали буквой
).
Полученные в этом параграфе результаты можно сформулировать в виде следующей теоремы:
Теорема 1. Общее решение матричного уравнения
,
где

задается формулой
. (17)
Здесь
– общее решение уравнения
– имеет следующую структуру:
разбивается на блоки
;
если
, то на месте
стоит нулевая матрица, если же
, то на месте
стоит произвольная правильная верхняя треугольная матрица.
, а следовательно, и
зависят линейно от
произвольных параметров
:
, (18)
где
определяется формулой
(19)
[здесь
обозначает степень наибольшего общего делителя
и
].
Заметим, что матрицы
, фигурирующие в формуле (18), суть решения исходного уравнения (1) (матрица
получается из
, если параметру
дать значение единицы, а остальным параметрам – нулевые значения;
). Эти решения линейно независимы, так как в противном случае при некоторых значениях параметров
, не равных одновременно нулю, матрица
, а следовательно, и
равнялись бы нулю, что невозможно. Таким образом, равенство (19) показывает, что любое решение исходного уравнения представляет собой линейную комбинацию
линейно независимых решений.
Если матрицы
и
не имеют общих характеристических чисел (характеристические многочлены
и
взаимно просты), то
и, следовательно,
, т. е. в этом случае уравнение (1) имеет только тривиальное нулевое решение
.
Замечание. Пусть элементы матриц
и
принадлежат некоторому числовому полю
. Тогда нельзя утверждать, что элементы матриц
фигурирующих в формуле (17), также принадлежат полю
. Элементы этих матриц можно выбрать в расширенном поле
, которое получается из поля
путем приобщения к последнему корней характеристических уравнений
и
. С такого рода расширением основного поля всегда приходится иметь дело, когда пользуются приведением заданных матриц к нормальной жордановой форме.
Однако матричное уравнение (1) эквивалентно системе
линейных однородных уравнении, где неизвестными служат элементы
искомой матрицы
:
. (20)
Нами доказано, что эта система имеет
линейно независимых решений, где
определяется формулой (19). Но известно, что базисные линейно независимые решения можно выбрать в основном поле
, которому принадлежат коэффициенты уравнений (20). Таким образом, в формуле (18) матрицы
можно выбрать так, чтобы их элементы принадлежали полю
. Тогда, придавая в формуле (18) произвольным параметрам всевозможные значения из поля
, мы получим все матрицы
с элементами из
, удовлетворяющие уравнению (1).