§ 3. Метод параллельных касательных (партан)
          
          
          Выше было показано, как процесс, описанный в § 1, приводит к методу сопряженных градиентов, если отыскание условного максимума в пространстве  заменить равноценным поиском максимума на прямой. Там же показано, что равноценным будет также поиск на двумерной плоскости, проходящей через точку
 заменить равноценным поиском максимума на прямой. Там же показано, что равноценным будет также поиск на двумерной плоскости, проходящей через точку  и два исходящих из нее вектора
 и два исходящих из нее вектора  и
 и  , т. е. точка
, т. е. точка  может быть представлена в виде
 может быть представлена в виде
          
          или, иначе,
           
   .
.
          Для нахождения максимума квадратичной функции на плоскости можно использовать различные методы. Метод, известный под названием «партан» или «метод параллельных касательных», основан на простом геометрическом принципе.
          На рис. 28 изображены линии уровня функции  , представляющие собой подобные концентрические эллипсы.
, представляющие собой подобные концентрические эллипсы.
          
          Рис. 28.
          Пусть  – произвольная точка,
 – произвольная точка,  – линия уровня (эллипс), проходящая через
 – линия уровня (эллипс), проходящая через  ,
,  – касательная к эллипсу в точке
 – касательная к эллипсу в точке  ,
,  – градиент функции
 – градиент функции  в точке
 в точке  . Очевидно, что градиент
. Очевидно, что градиент  нормален к линии уровня, т. е. перпендикулярен касательной
 нормален к линии уровня, т. е. перпендикулярен касательной  .
.
          Точка  определяется как точка максимума функции
 определяется как точка максимума функции  на прямой
 на прямой  , проходящей через
, проходящей через  в направлении градиента
 в направлении градиента  . В точке
. В точке  эта прямая касается некоторой линии уровня. Поэтому градиент
 эта прямая касается некоторой линии уровня. Поэтому градиент  в точке
 в точке  перпендикулярен вектору
 перпендикулярен вектору  и, следовательно, прямая
 и, следовательно, прямая  , проходящая через
, проходящая через  в направлении
 в направлении  , параллельна
, параллельна  . Далее, точка
. Далее, точка  находится как точка максимума
 находится как точка максимума  на прямой
 на прямой  , где она касается эллипса
, где она касается эллипса  . Очевидно, что подобным сжатием можно перевести одновременно прямую
. Очевидно, что подобным сжатием можно перевести одновременно прямую  и эллипс
 и эллипс  в прямую
 в прямую  и эллипс
 и эллипс  . При этом точка
. При этом точка  перейдет в
 перейдет в  . Но при подобном сжатии к центру точка
. Но при подобном сжатии к центру точка  перемещается по прямой, проходящей через центр эллипсов. Поэтому прямая
 перемещается по прямой, проходящей через центр эллипсов. Поэтому прямая  проходит через центр эллипсов, т. е. точку максимума функции на плоскости. Таким образом, приходим к следующему способу:
 проходит через центр эллипсов, т. е. точку максимума функции на плоскости. Таким образом, приходим к следующему способу:
          1) из произвольной точки  провести прямую
 провести прямую  в направлении градиента функции
 в направлении градиента функции  в точке
 в точке  ;
;
          2) на этой прямой найти точку условного максимума  ;
;
          3) через  провести прямую в направлении градиента и на этой прямой найти точку
 провести прямую в направлении градиента и на этой прямой найти точку  , доставляющую условный максимум;
, доставляющую условный максимум;
          4) соединить точки  и
 и  прямой и найти точку максимума на этой прямой. Найденная точка есть точка, доставляющая максимум функции на всей плоскости.
 прямой и найти точку максимума на этой прямой. Найденная точка есть точка, доставляющая максимум функции на всей плоскости.
          Вернемся теперь к задаче о нахождении максимума  в
 в  -мерном пространстве
-мерном пространстве  . В соответствии со сказанным выше, процесс, описанный в § 1, может быть приведен к следующему виду.
. В соответствии со сказанным выше, процесс, описанный в § 1, может быть приведен к следующему виду.
          А. Начальный шаг.
          1) В произвольной точке  пространства
 пространства  находится градиент
 находится градиент  функции
 функции  ;
;
          2) на прямой  ищется точка
 ищется точка  , доставляющая максимум функции
, доставляющая максимум функции  .
.
          Б. Общий шаг. Пусть уже найдены точки 
          1) В точке  находится градиент
 находится градиент  функции
 функции  ;
;
          2) на плоскости, проходящей через точки  и параллельной направлению
 и параллельной направлению  , т. е. на плоскости
, т. е. на плоскости
           ,
,
          ищется точка  , доставляющая условный максимум функции
, доставляющая условный максимум функции  .
.
          В. Останов алгоритма. Процесс прекращается, когда на очередном шаге окажется, что  . Тогда
. Тогда  – точка максимума
 – точка максимума  во всем пространстве
 во всем пространстве  .
.
          Для осуществления пункта 2) общего шага применим метод параллельных касательных. Обозначим  двумерную плоскость вида
 двумерную плоскость вида
          
          ( и
 и  – параметры) и, начиная с точки
 – параметры) и, начиная с точки  , будем действовать по методу «партан». Прежде всего необходимо найти в точке
, будем действовать по методу «партан». Прежде всего необходимо найти в точке  условный градиент функции
 условный градиент функции  на плоскости
 на плоскости  . Известно, что условный градиент на гиперпространстве
. Известно, что условный градиент на гиперпространстве  есть проекция полного градиента на это гиперпространство. Таким образом, нам нужно спроектировать вектор
 есть проекция полного градиента на это гиперпространство. Таким образом, нам нужно спроектировать вектор  на плоскость
 на плоскость  . Но в соответствии с (16.2) и (16.3) вектор
. Но в соответствии с (16.2) и (16.3) вектор  ортогонален
 ортогонален  , а векторы
, а векторы  и
 и  ортогональны между собой. Поэтому проекция
 ортогональны между собой. Поэтому проекция  на плоскость
 на плоскость  коллинеарна вектору
 коллинеарна вектору  .
.
          Прямая, проходящая через точку  в направлении условного градиента на плоскости, имеет, таким образом вид
 в направлении условного градиента на плоскости, имеет, таким образом вид
           ,
,
          а точка максимума на этой прямой есть  , так как эта прямая принадлежит пространству
, так как эта прямая принадлежит пространству  и
 и  доставляет максимум
 доставляет максимум  на всем
 на всем  .
.
          Итак, оказывается, что первый шаг двумерного «партана» фактически уже выполнен и точка  этого алгоритма совпадает с
 этого алгоритма совпадает с  .
.
          Далее, нужно взять условный градиент  в точке
 в точке  . Но направление полного градиента
. Но направление полного градиента  в точке
 в точке  принадлежит гиперплоскости
 принадлежит гиперплоскости  . Поэтому условный градиент совпадает с полным. Теперь через точку
. Поэтому условный градиент совпадает с полным. Теперь через точку  нужно провести прямую
 нужно провести прямую
          
          и найти на этой прямой точку  , доставляющую условный максимум
, доставляющую условный максимум  . Наконец, точку
. Наконец, точку  необходимо соединить с
 необходимо соединить с  прямой и на этой прямой найти точку, в которой достигается условный максимум
 прямой и на этой прямой найти точку, в которой достигается условный максимум  . Эта точка и есть
. Эта точка и есть  .
.
          Таким образом, общий шаг алгоритма приобретает следующий вид:
          1) в точке  находится градиент
 находится градиент  ,
,
          2) на прямой  определяется точка
 определяется точка  , в которой функция
, в которой функция  достигает условного экстремума по формуле
 достигает условного экстремума по формуле
           ,
,
          где
           ;
;
          3) на прямой  ищется точка
 ищется точка  , доставляющая условный экстремум
, доставляющая условный экстремум  , по формуле
, по формуле
           ,
,
          где
           .
.
          Эти формулы получены в соответствии с общей формулой (16.16), выведенной в § 2. Отметим, что при точном счете процесс должен закончиться не более чем через  шагов.
 шагов.
          Метод параллельных касательных может быть применен и в случае неквадратичной функции, при этом поиск условного экстремума на прямой должен производиться одним из известных методов одномерного поиска. Однако при этом нет никаких гарантий, что процесс закончится через  шагов. Экспериментально же установлено, что этот метод поиска сходится значительно лучше, чем методы наискорейшего спуска или Гаусса-Зайделя.
 шагов. Экспериментально же установлено, что этот метод поиска сходится значительно лучше, чем методы наискорейшего спуска или Гаусса-Зайделя.