5.1.5. Проективные преобразования

Как выше уже было сказано, общими линейными преобразованиями (в представлении однородными координатами)

(5.7)

формируется группа проективных преобразований (рис.5.3). При представлении в обычных координатах, очевидно соотношение (5.7) будет иметь нелинейный вид, связанный с перенормировкой

Проективные преобразования, в общем-то, не сохраняют параллельности линий. Свойством, сохраняющимся при проективном преобразовании, является так называемая коллинеарность точек: три точки, лежащие на одной прямой (то есть коллинеарные), после преобразования остаются лежать на одной прямой(см.рис.5.3). Поэтому обратимое проективное преобразование принято называть еще коллинеацией.

Проективное преобразование связано с отображением трехмерной визуальной информации на двумерную плоскость. С математической точки зрения удобно рассматривать мир, включенным в трехмерное проективное пространство , а плоскость изображения, включенной в проективное пространство размерности два - . Точки на трехмерной сцене и на изображении представляются в проективных пространствах как векторы в однородных координатах.

Проективное преобразование из в (перспективная проекция), отображающее евклидову точку сцены в точку изображения и выраженное в однородных координатах, задается в виде:

=. (5.8)

а)

б)


в)	г)

Рис.5.3.

а) действие проективного преобразования на пять точек плоскости; б) исходное изображение; в) и г) проективно преобразованные образы; параметры проективного преобразования соответственно:

Однородные координаты векторов проективного пространства и проективной плоскости соотносятся с неоднородными (евклидовыми) координатами векторов и заданным выше образом: и .

Проективная геометрия составляет математический базис машинного зрения и компьютерной графики. Основные области применения связаны с описанием как процесса формирования изображений, так и их инвариантного представления, а именно: калибровка регистрирующей камеры, анализ движения по серии изображений, распознавание образов, реконструкция сцен по стереоснимкам, синтез изображений, анализ и восстановление формы по полутонам. Полезно отметить тот факт, что композиция двух перспективных проекций не является с необходимостью перспективной проекцией, но определяет проективное преобразование; то есть (как мы знаем) проективные преобразования формируют группу, в то время как перспективные проекции - нет.

В связи с этим напомним, что изображение объектов на снимке, сформированном регистрирующей камерой, связано с чрезвычайно важной геометрической операцией - проектированием при помощи пучка прямых, поскольку каждая 2D точка является проекцией множества 3D точек вдоль некоторого направления («луча проектирования») в плоскость снимка (рис.5.4). Предположим, что плоскость снимка камеры в системе координат определяется соотношением . Простая геометрия показывает,

что если расстояние от плоскости изображения до центра проекции равно , то координаты элементов изображения соотносятся с пространственными координатами объекта следующим образом

. (5.9)

Это нелинейные уравнения. Они могут быть сделаны линейными введением однородных координат. Заметим, что луч, проходящий через 2D точку , является направляющим вектором прямой, соединяющей точки и . В то же время 3D точка также лежит на этом луче (и представляет его). Припроизвольном (пробегающем всевозможные значения) получим координаты всех 3D точек на этом луче, соответствующих единственной точке на изображении в плоскости . По существу, каждая точка на изображении определяет луч, идущий от сцены в начало координат. Следовательно, однородные координаты точки (на снимке) в действительности представляют (и определяют) линию, проходящую через начало в евклидовом трехмерном пространстве . Такой набор всевозможных линий, проходящих через начало и формирует проективное 2D-пространство в плоскости . (Можно, конечно, положить фокусное расстояние , поскольку различным значениямсоответствует разный масштаб изображения). В однородных координатах уравнения (5.9) естественно имеют вид (5.8)

Рис.5.4. Перспективная проекция

(5.9’)

Замечание. При , 3D точка , в общем-то, определяет линию, параллельную плоскости , не имеющую с ней точек пересечения и, следовательно, не имеет соответствия с какой-либо конечной точкой изображения. Такие линии или однородные векторы могут, тем не менее, иметь смысл, если считать, что соответствующая им точка удаляется на бесконечность в направлении, задаваемом этими координатами:

Мы можем добавить все такие точки к проективной плоскости. Эти точки называются «идеальными» или точками на бесконечности. На изображениях проективной плоскости добавленные точки на бесконечности формируют «линию горизонта» (см. рис.5.5). Существует разделение идеальных точек, обусловленное различными направлениями на плоскости; например, точки (1,0,0) и (0,1,0) связаны с горизонтальным и вертикальным направлениями (осями координат) соответственно. Можно также сказать, что все идеальные точки лежат на линии, называемой «идеальной линией» или линией на бесконечности, которая рассматривается, тем не менее, как и обычная линия. Идеальная линия представляется в виде (0,0,1).

Определение. Проективная плоскость является аффинной плоскостью с присоединенными идеальной линией и множеством идеальных точек, которые не отличаются от обычных линий и точек [5.12]. (Аффинная плоскость, естественно, состоит из тех же точек, что и евклидова плоскость. Различие состоит в том, что в первой допускаются неоднородное масштабирование и косоугольность.)

Рис.5.5. Проективная плоскость = аффинная плоскость + идеальные точки (идеальная линия)

Замечание. Найдем пересечение двух прямых и . Несложные вычисления показывают, что однородные координаты точки пересечения равны . Последняя формула легко запоминается, поскольку есть не что иное, как векторное произведение: . Если эти две прямые линии параллельны, то есть , то точка пересечения существует (идеальная точка!) и равна . Двойственным образом, задавая две точки и , можно непосредственно найти прямую, проходящую через них: .

Таким образом, идеализация процесса формирования изображения камерой может быть представлена как перспективная проекция из в . Допустим, что 3D координаты точек объекта известны. Тогда, зная элементы матрицы , относящиеся к данному проективному преобразованию, точки пространственного объекта можно связать с соответствующими им координатами на снимке в виде (5.8)

=. (5.10)

Очевидно, что неизвестный масштабный множитель определяется как

так что координаты изображения объекта имеют вид отношения

, (5.11)

Пусть координаты характерных элементов изображения объекта соотнесены с пространственными координатами точек объекта и требуется вычислить элементы матрицы (то есть осуществить так называемую калибровку камеры, см. главу 6). По крайней мере 6 точек объекта нужно идентифицировать для этого на снимке (), поскольку элементы матрицы определены с точностью до масштабного множителя (только лишь отношения элементов значимы) и существует 11 степеней свободы (неизвестных параметров). Обычно же требуется большее число точек, так как измерения сопровождаются помехами и оптимальное решение, минимизирущее их влияние на результат, находится методом наименьших квадратов.

Проективным базисом на плоскости является множество из 4 точек, таких, что любые три из них не лежат на прямой. Соответственно, матрица, сформированная вектор-столбцами однородных координат любых 3 точек, должна иметь полный ранг. Легко проверить, например, что точки формируют так называемый канонический базис. В соответствии с приведенным выше замечанием, канонический базис содержит точки на бесконечности вдоль каждой координатной оси , начало и единичную точку . Очевидно, что коллинеация на : целиком характеризуется геометрически ее действием на точки базиса.

Элементы матрицы определены с точностью до масштабного множителя, и из них лишь восемь значений независимы. Поэтому, поскольку каждая точка содержит две независимых координаты, то четыре пары сопряженных точек (на двух снимках) позволяют определить .

Мы знаем, что аффинная плоскость, в отличие от проективной плоскости, не содержит идеальных точек. Тогда точка должна быть трансформируема в точку для произвольного масштабного множителя :

что влечет . Матрица аффинного преобразования имеет вид , и здесь содержится лишь шесть независимых параметров, поскольку масштаб также не важен.