§ 8.19. Условный (относительный) экстремум

Рассмотрим в пространстве функцию . С геометрической точки зрения эта функция представляет собой квадрат расстояния точки от начала прямоугольной системы координат . Она не имеет наибольшего значения в . Но если ее рассматривать только для точек эллипса , то ясно, что она достигает наибольшего значения в точках и (рис. 101).

Рис. 101

Таким образом, функция , рассматриваемая во всей плоскости , не имеет наибольшего значения, но эта же функция при условии, что точка находится на эллипсе, принимает наибольшее значение (два раза).

Эта ситуация приводит нас к задаче об отыскании экстремума функции при условии, что ее аргументы удовлетворяют некоторым дополнительным ограничениям. Итак, пусть дана функция

от переменных. Требуется найти экстремум функции при условии, что переменные связаны соотношениями

(1)

которые обычно называются уравнениями связи.

Система уравнений (1) определяет в пространстве , вообще говоря, некоторое множество, которое мы будем называть поверхностью.

О п р е д е л е н и е. Будем говорить, что точка , удовлетворяющая уравнениям (1), является точкой локального условного (относительного) максимума (минимума), если в окрестность точки такая, что из этой окрестности, удовлетворяющих уравнениям связи (1), выполняется неравенство

Точка локального условного максимума или минимума называется точкой локального условного (относительного) экстремума.

В рассмотренном выше примере точка является точкой условного локального максимума, так как для всех точек , лежащих на эллипсе, .

Займемся сначала выяснением вопроса о необходимых условиях, чтобы точка была точкой локального относительного экстремума. Пусть - точка условного экстремума и функции , имеют непрерывные частные производные и якобиан

(2)

в окрестности этой точки.

Как нам известно, система (1) разрешима относительно переменных в некоторой окрестности точки :

где функции имеют непрерывные частные производные в точке .

Подставляя эти функции в , получим, что будет функцией только от переменных , независимых между собой:

. (3)

Очевидно, что если достигает локального условного экстремума в точке , то достигает в точке обычного локального экстремума, или, как говорят, абсолютного локального экстремума, и обратно.

Но тогда, как мы знаем, должны выполняться равенства

, (4)

где - дифференциалы независимых переменных.

Точку , для которой в силу (1) (или (3)) выполняются (4), будем называть стационарной точкой функции при наличии связей (1) .

Мы доказали, что для того, чтобы точка была точкой локального условного экстремума, необходимо, чтобы она была стационарной точкой при наличии связей (1).

Дальнейшие наши рассмотрения относятся к вопросу о том, как найти указанную стационарную точку, не разрешая систему (1) относительно переменных , хотя существование функций мы будем предполагать. Будем писать вместо .

В силу инвариантности формы дифференциала первого порядка, условия (4) эквивалентны условиям:

, (5)

где входящие в зависимые дифференциалы , соответственно равны

Эти дифференциалы вместе с независимыми дифференциалами связаны соотношениями

, (6)

которые мы получаем из уравнений связи.

Итак, стационарная точка функции при наличии связей (1) может быть определена так же, как такая точка , удовлетворяющая уравнениям (1), что для нее выполняются равенства (5) для всех , , для которых имеют место равенства (6).

Введем - мерные векторы

На языке этих векторов уравнения (5) и (6) можно записать через скалярные произведения

, (5’)

. (6’)

Мы получили, что точка есть стационарная точка при наличии связей (1) тогда и только тогда, когда она удовлетворяет уравнениям (1), и если из того, что какой-либо вектор ортогонален к градиентам , следует, что он ортогонален к . Но в таком случае (пояснения ниже) существует и притом единственная система чисел такая, что

. (7)

Обратное утверждение тоже верно. Если известно, что при некоторых числах может быть представлен в виде (7), т. е. в виде линейной комбинации градиентов , то отсюда немедленно следует, что как только какой-либо вектор ортогонален к градиентам , он автоматически ортогонален к .

Убедиться в верности обратного утверждения не представляет никакого труда: из (7) и (6’) следует, что

Что же касается утверждения, то мы сошлемся на теорему из линейной алгебры. Все же сделаем пояснения.

Пусть есть линейное подпространство , натянутое на векторы , т. е. множество линейных комбинаций вида (7), соответствующих всевозможным системам чисел . Введем подпространство векторов , ортогональное к , т. е. состоит из всех векторов , ортогональных к , или, что все равно, ортогональных к векторам . Если ортогонально к , то и, обратно, ортогонально к , т. е. состоит из всех векторов, ортогональных к . Как было сказано в стационарной точке , градиент ортогонален ко всем векторам , ортогональным к градиентам , т. е. градиент ортогонален к . Но тогда по указанной теореме градиент принадлежит к , таким образом есть некоторая линейная комбинация из градиентов , единственная линейная комбинация, потому что градиенты образуют линейно независимую систему в . Дело в том, что матрица из частных производных функций

(8)

имеет в окрестности точки ранг , потому что мы предположили верным условие (2), но тогда строки этой матрицы определяют векторы (градиенты), образующие линейно независимую систему.

Из сказанного следует, что стационарную точку функции при наличии связей (1) можно определить еще и так: это такая точка , удовлетворяющая уравнениям (1), для которой градиент есть линейная комбинация из градиентов

. (7)

Можно еще сказать так: для того чтобы точка

была стационарной для функции при наличии связей (1), необходимо и достаточно, чтобы для нее существовали числа , для которых выполняется равенство (7).

Так как ранг матрицы (8) в точке равен , то каждой стационарной точке соответствует единственная система чисел , для которых имеет место равенство (7). Равенство (7) эквивалентно следующему:

. (9)

Функцию, стоящую под знаком градиента в (9)

называют функцией Лагранжа, а числа множителями Лагранжа.

Запишем условия (9) в развернутом виде:

(9’)

Вопрос о нахождении стационарных точек при наличии связей (1) свелся к решению системы, состоящей из уравнений (1) и .

Резюмируем сказанное.

Чтобы найти стационарную точку

функции при наличии связей, надо составить функцию Лагранжа и систему уравнений (9’) и решить эту систему совместно с уравнениями связи (1). Всего здесь будет уравнений с неизвестными . При этом решение системы относительно и даст точку , которая будет стационарной точкой. Точки локального условного экстремума находятся среди стационарных точек. Выяснение вопроса о том, будет ли на самом деле стационарная точка точкой условного экстремума, удобно проводить, рассматривая второй дифференциал функции Лагранжа. При выяснении знака нужно учитывать, что дифференциалы зависят от дифференциалов .

П р и м е р. Пусть на плоскости дана фигура, ограниченная осями координат и параболой . Вписать в эту фигуру прямоугольник со сторонами, параллельными осям координат, одна из вершин которого находится на этой параболе, так, чтобы площадь прямоугольника была наибольшей (рис. 102).

Рис. 102

Р е ш е н и е. Пусть и - координаты вершины . Тогда площадь прямоугольника . Далее, так как точка лежит на параболе, то ее координаты должны удовлетворять уравнению параболы: . Таким образом, мы должны исследовать на условный экстремум функцию при наличии связи . Составим функцию Лагранжа . Найдем стационарные точки задачи из уравнений

Решая эту систему, находим, что . Таким образом. Точка стационарная и ей отвечает множитель Лагранжа . Исследуем в стационарной точке второй дифференциал функции Лагранжа

Имеем

где последние два члена в правой части возникают потому, что дифференциалы и зависимы и, вообще говоря, . Однако в стационарной точке .

Поэтому

Если считать и как дифференциалы независимых переменных, то не является определенным по знаку. Однако из уравнения связи видно, что и в точке . Таким образом,

а, следовательно, и приращение функции в точке , соответствующее приращению , равному , меньше нуля (). Значит, функция имеет в точке локальный условный максимум.

Итак, из всех прямоугольников указанного вида наибольшую площадь имеет прямоугольник со сторонами .