Программное исправление искажения «рыбий глаз»

ОБНОВЛЕНИЕ СТАТУСА ПРАКТИКИ:

Я обнаружил, как отображать линейную линзу, от destination координат до source координат.

Как рассчитать радиальное расстояние от центра, чтобы перейти от "рыбий глаз" к прямолинейному?

1). Я на самом деле изо всех сил пытаюсь изменить это и сопоставить исходные координаты с координатами назначения. Что такое обратное, в коде в стиле функций преобразования, которые я разместил?
2). Я также вижу, что у меня неисторженность неидеальна на некоторых объективах — предположительно на тех, которые не являются строго линейными. Каковы эквивалентные координаты источника и места назначения для этих объективов? Опять же, больше кода, чем просто математические формулы...

Вопрос в первоначальной форме:

У меня есть несколько точек, описывающих положение на снимке, сделанном с помощью объектива «рыбий глаз».

Я хочу преобразовать эти точки в прямолинейные координаты. Я хочу не искажать изображение.

Я нашел это описание того, как создать эффект "рыбий глаз", но не то, как его обратить.

Также есть сообщение в блоге, в котором описывается, как использовать инструменты для этого; эти картинки оттуда:

(1) : SOURCE Ссылка на исходное фото
< img src="https://i.stack.imgur.com/qLNQV.jpg" width="500" height="334" />
Входные данные: Исходное изображение с искажением "рыбий глаз", которое нужно исправить.

(2) : DESTINATION Ссылка на исходное фото
< img src="https://i.stack.imgur.com/ogb9b.jpg" width="500" height="237" />
Вывод: Исправленное изображение (технически также с коррекцией перспективы, но это отдельный шаг).

Как рассчитать радиальное расстояние от центра, чтобы перейти от «рыбий глаз» к прямолинейному?

Моя заглушка функции выглядит так:

Point correct_fisheye(const Point& p,const Size& img) { // to polar const Point centre = {img.width/2,img.height/2}; const Point rel = {p.x-centre.x,p.y-centre.y}; const double theta = atan2(rel.y,rel.x); double R = sqrt((rel.x*rel.x)+(rel.y*rel.y)); // fisheye undistortion in here please //... change R ... // back to rectangular const Point ret = Point(centre.x+R*cos(theta),centre.y+R*sin(theta)); fprintf(stderr,"(%d,%d) in (%d,%d) = %f,%f = (%d,%d)\n",p.x,p.y,img.width,img.height,theta,R,ret.x,ret.y); return ret; }

В качестве альтернативы я мог бы каким-то образом преобразовать изображение из «рыбьего глаза» в прямолинейное, прежде чем находить точки, но я совершенно сбит с толку Документация OpenCV. Есть ли простой способ сделать это в OpenCV, и достаточно ли хорошо он работает, чтобы делать это в прямом эфире?

math geometry graphics projection

Will    19.03.2010    источник

comment

Я не совсем понимаю, что вы ищете. Карты «рыбий глаз» со сферы на плоскость изображения. Обратное отображение будет из картинки обратно в сферу, верно? Какую прямолинейную координату вы ищете?   -   mtrw    20.03.2010

comment

@mtrw Мое исходное изображение искажено «рыбий глаз», и я хочу, чтобы оно не искажалось   -   Will    20.03.2010

comment

Итак, изображение на photo.net/learn/fisheye — это то, что вам нужно?   -   mtrw    20.03.2010

comment

Да, исправленное изображение, например. через OpenCV, или формулу для исправления любой точки на картинке.   -   Will    21.03.2010

comment

Вам нужно сделать это для ряда камер или только для одной камеры/одного типа объектива?   -   Kirk Broadhurst    23.03.2010

comment

Уилл, ты когда-нибудь получал исчерпывающий ответ на этот вопрос? Мне было бы очень интересно увидеть какой-нибудь код, который у вас получился.   -   Nestor    07.06.2010

comment

@ Уилл, я знаю, что с тех пор, как был задан этот вопрос, прошло много времени, но у меня похожая проблема - вы когда-нибудь получали фрагмент функционального кода для преобразования, включая упомянутую вами коррекцию перспективы?   -   jogall    28.07.2014

comment

@jogal В итоге я использовал решение, которое я разместил ниже; удачи!   -   Will    30.07.2014

Ответы (6)

arrow_upward
34
arrow_downward

В описании, которое вы упомянули, указано, что проекция с помощью камеры с точечным отверстием (без искажения объектива) моделируется

R_u = f*tan(theta)

а проекция обычных камер с объективом «рыбий глаз» (то есть искаженная) моделируется

R_d = 2*f*sin(theta/2)

Вы уже знаете R_d и тета, и если бы вы знали фокусное расстояние камеры (представленное f), то исправление изображения равносильно вычислению R_u с точки зрения R_d и тета. Другими словами,

R_u = f*tan(2*asin(R_d/(2*f)))

формула, которую вы ищете. Оценка фокусного расстояния f может быть решена путем калибровки камеры или других средств, таких как предоставление пользователю возможности оставить отзыв о том, насколько хорошо исправлено изображение, или использование знаний из исходной сцены.

Чтобы решить ту же проблему с помощью OpenCV, вам нужно будет получить внутренние параметры камеры и коэффициенты искажения объектива. См., например, главу 11 Изучение OpenCV (не забудьте проверить исправление). Затем вы можете использовать программу, подобную этой (написанную с привязками Python для OpenCV), чтобы изменить искажение объектива:

#!/usr/bin/python # ./undistort 0_0000.jpg 1367.451167 1367.451167 0 0 -0.246065 0.193617 -0.002004 -0.002056 import sys import cv def main(argv): if len(argv) < 10: print 'Usage: %s input-file fx fy cx cy k1 k2 p1 p2 output-file' % argv[0] sys.exit(-1) src = argv[1] fx, fy, cx, cy, k1, k2, p1, p2, output = argv[2:] intrinsics = cv.CreateMat(3, 3, cv.CV_64FC1) cv.Zero(intrinsics) intrinsics[0, 0] = float(fx) intrinsics[1, 1] = float(fy) intrinsics[2, 2] = 1.0 intrinsics[0, 2] = float(cx) intrinsics[1, 2] = float(cy) dist_coeffs = cv.CreateMat(1, 4, cv.CV_64FC1) cv.Zero(dist_coeffs) dist_coeffs[0, 0] = float(k1) dist_coeffs[0, 1] = float(k2) dist_coeffs[0, 2] = float(p1) dist_coeffs[0, 3] = float(p2) src = cv.LoadImage(src) dst = cv.CreateImage(cv.GetSize(src), src.depth, src.nChannels) mapx = cv.CreateImage(cv.GetSize(src), cv.IPL_DEPTH_32F, 1) mapy = cv.CreateImage(cv.GetSize(src), cv.IPL_DEPTH_32F, 1) cv.InitUndistortMap(intrinsics, dist_coeffs, mapx, mapy) cv.Remap(src, dst, mapx, mapy, cv.CV_INTER_LINEAR + cv.CV_WARP_FILL_OUTLIERS, cv.ScalarAll(0)) # cv.Undistort2(src, dst, intrinsics, dist_coeffs) cv.SaveImage(output, dst) if __name__ == '__main__': main(sys.argv)

Также обратите внимание, что OpenCV использует модель искажения объектива, которая сильно отличается от модели на веб-странице, на которую вы ссылаетесь.

jmbr    21.03.2010

comment

Это зависит от наличия доступа к рассматриваемой камере. Я не делаю, я просто получаю видео. Кроме того, мне приходит в голову, что камеры выпускаются серийно, и не может быть больших вариаций по отдельности? Инструменты, указанные в исходной статье, не требуют, чтобы кто-то стоял перед камерой с шахматной доской!? - Will; 21.03.2010

comment

Параметры камеры варьируются в зависимости от одной и той же камеры, просто настраивая масштаб. Кроме того, вы можете полагаться на методы автоматической калибровки вместо использования шахматной доски. В любом случае, я отредактировал свой ответ, чтобы ответить на первую часть вашего вопроса, предоставив вам формулу, которую вы искали. - jmbr; 22.03.2010

comment

Спасибо jmbr! Мир начинает обретать какой-то смысл. На самом деле я не могу заставить R_u = f*tan(2*asin(R_d/(2*f))) дать мне что-нибудь, кроме NaN. Я ничего не знаю о тригонометрии, и именно это меня сейчас сдерживает :( - Will; 22.03.2010

comment

Это было принято автоматически - я ждал более четкого ответа на заданный мною вопрос. - Will; 28.03.2010

comment

@Will: поскольку система наград была улучшена, теперь вы можете принять и другой ответ. - Tobias Kienzler; 24.03.2011

arrow_upward
8
arrow_downward

(Исходный постер, представляющий альтернативу)

Следующая функция сопоставляет целевые (прямолинейные) координаты с исходными (искаженными «рыбий глаз») координатами. (Буду признателен за помощь в восстановлении)

Я пришел к этому методом проб и ошибок: я не совсем понимаю, почему этот код работает, благодарны пояснения и повышенная точность!

def dist(x,y): return sqrt(x*x+y*y) def correct_fisheye(src_size,dest_size,dx,dy,factor): """ returns a tuple of source coordinates (sx,sy) (note: values can be out of range)""" # convert dx,dy to relative coordinates rx, ry = dx-(dest_size[0]/2), dy-(dest_size[1]/2) # calc theta r = dist(rx,ry)/(dist(src_size[0],src_size[1])/factor) if 0==r: theta = 1.0 else: theta = atan(r)/r # back to absolute coordinates sx, sy = (src_size[0]/2)+theta*rx, (src_size[1]/2)+theta*ry # done return (int(round(sx)),int(round(sy)))

При использовании с коэффициентом 3,0 он успешно искажает изображения, используемые в качестве примеров (я не пытался интерполировать качество):

~~Неработающая ссылка~~

(А это из поста в блоге, для сравнения :)

Will    23.03.2010

comment

Причина, по которой ваш код работает, заключается в том, что вы масштабируете (rx, ry) с коэффициентом тета (который теперь является отношением, а не углом). Если исходный объектив имеет (как говорится в статье вики) линейное отображение от угла обзора до смещения изображения, я считаю, что atan (r) / r является правильным. - comingstorm; 24.03.2010

comment

Обратное отображение должно масштабироваться с коэффициентом tan(r')/r', где r' — радиус от центра неискаженного изображения. - comingstorm; 24.03.2010

comment

И причина того, что оба эти метода работают, заключается в том, что если у вас есть вектор v' = v*k(|v|), и вы хотите, чтобы |v'|=f(|v|), вы берете абсолютное значение первого уравнения : |v'|=|v|*k(|v|)=f(|v|) -- так что k(|v|)=f(|v|)/|v| - comingstorm; 24.03.2010

comment

@comingstorm, так что же такое эквивалент для нелинейного отображения? - Will; 24.03.2010

comment

@stkent, так что я делаю это в R, и это работает, за исключением того, что в зависимости от фактора, который я выбираю, я вижу «волны», наложенные на изображения, которые я растягиваю или не растягиваю. Например, я получаю бочкообразную дисторсию, как хотелось бы, но затем поверх нее появляется какой-то псевдоним, похожий на артефакт светло-серых волн. Интересно, это какая-то проблема с границей или фазовый сдвиг? Пример: imgur.com/a/lBNXPYh - SqueakyBeak; 19.03.2019

arrow_upward
4
arrow_downward

Если вы считаете, что ваши формулы точны, вы можете вычислить точную формулу с помощью триггера, например:

Rin = 2 f sin(w/2) -> sin(w/2)= Rin/2f Rout= f tan(w) -> tan(w)= Rout/f (Rin/2f)^2 = [sin(w/2)]^2 = (1 - cos(w))/2 -> cos(w) = 1 - 2(Rin/2f)^2 (Rout/f)^2 = [tan(w)]^2 = 1/[cos(w)]^2 - 1 -> (Rout/f)^2 = 1/(1-2[Rin/2f]^2)^2 - 1

Однако, как говорит @jmbr, фактическое искажение камеры будет зависеть от объектива и увеличения. Вместо того, чтобы полагаться на фиксированную формулу, вы можете попробовать полиномиальное расширение:

Rout = Rin*(1 + A*Rin^2 + B*Rin^4 + ...)

Изменяя сначала A, а затем коэффициенты более высокого порядка, вы можете вычислить любую разумную локальную функцию (форма разложения использует преимущества симметрии задачи). В частности, должна быть возможность вычислить начальные коэффициенты для аппроксимации приведенной выше теоретической функции.

Кроме того, для получения хороших результатов вам потребуется использовать интерполяционный фильтр для создания исправленного изображения. Пока искажение не слишком велико, вы можете без особых проблем использовать фильтр, который вы бы использовали для линейного масштабирования изображения.

Изменить: по вашему запросу эквивалентный коэффициент масштабирования для приведенной выше формулы:

(Rout/f)^2 = 1/(1-2[Rin/2f]^2)^2 - 1 -> Rout/f = [Rin/f] * sqrt(1-[Rin/f]^2/4)/(1-[Rin/f]^2/2)

Если вы построите приведенную выше формулу рядом с тангенсом (Rin/f), вы увидите, что они очень похожи по форме. По сути, искажение касательной становится серьезным до того, как sin(w) станет сильно отличаться от w.

Обратная формула должна быть примерно такой:

Rin/f = [Rout/f] / sqrt( sqrt(([Rout/f]^2+1) * (sqrt([Rout/f]^2+1) + 1) / 2 )

comingstorm    23.03.2010

arrow_upward
3
arrow_downward

Я вслепую реализовал формулы из здесь, поэтому не могу гарантировать, что они сделают то, что вам нужно.

Используйте auto_zoom, чтобы получить значение параметра zoom.

def dist(x,y): return sqrt(x*x+y*y) def fisheye_to_rectilinear(src_size,dest_size,sx,sy,crop_factor,zoom): """ returns a tuple of dest coordinates (dx,dy) (note: values can be out of range) crop_factor is ratio of sphere diameter to diagonal of the source image""" # convert sx,sy to relative coordinates rx, ry = sx-(src_size[0]/2), sy-(src_size[1]/2) r = dist(rx,ry) # focal distance = radius of the sphere pi = 3.1415926535 f = dist(src_size[0],src_size[1])*factor/pi # calc theta 1) linear mapping (older Nikon) theta = r / f # calc theta 2) nonlinear mapping # theta = asin ( r / ( 2 * f ) ) * 2 # calc new radius nr = tan(theta) * zoom # back to absolute coordinates dx, dy = (dest_size[0]/2)+rx/r*nr, (dest_size[1]/2)+ry/r*nr # done return (int(round(dx)),int(round(dy))) def fisheye_auto_zoom(src_size,dest_size,crop_factor): """ calculate zoom such that left edge of source image matches left edge of dest image """ # Try to see what happens with zoom=1 dx, dy = fisheye_to_rectilinear(src_size, dest_size, 0, src_size[1]/2, crop_factor, 1) # Calculate zoom so the result is what we wanted obtained_r = dest_size[0]/2 - dx required_r = dest_size[0]/2 zoom = required_r / obtained_r return zoom

Roman Zenka    24.03.2010

arrow_upward
3
arrow_downward

Я взял то, что сделал JMBR, и в основном изменил это. Он взял радиус искаженного изображения (Rd, то есть расстояние в пикселях от центра изображения) и нашел формулу для Ru, радиуса неискаженного изображения.

Вы хотите пойти другим путем. Для каждого пикселя в неискаженном (обработанном) изображении вы хотите знать, какой соответствующий пиксель находится в искаженном изображении. Другими словами, дано (xu, yu) --> (xd, yd). Затем вы заменяете каждый пиксель неискаженного изображения соответствующим ему пикселем искаженного изображения.

Начиная с JMBR, я делаю обратное, находя Rd как функцию Ru. Я получил:

Rd = f * sqrt(2) * sqrt( 1 - 1/sqrt(r^2 +1))

где f — фокусное расстояние в пикселях (объясню позже), а r = Ru/f.

Фокусное расстояние моей камеры было 2,5 мм. Размер каждого пикселя на моей ПЗС-матрице был равен 6 мкм в квадрате. Следовательно, f было 2500/6 = 417 пикселей. Это можно найти методом проб и ошибок.

Поиск Rd позволяет найти соответствующий пиксель в искаженном изображении с использованием полярных координат.

Угол каждого пикселя от центральной точки одинаков:

theta = arctan( (yu-yc)/(xu-xc) ) где xc, yc — центральные точки.

Потом,

xd = Rd * cos(theta) + xc yd = Rd * sin(theta) + yc

Убедитесь, что вы знаете, в каком квадранте вы находитесь.

Вот код С#, который я использовал

public class Analyzer { private ArrayList mFisheyeCorrect; private int mFELimit = 1500; private double mScaleFESize = 0.9; public Analyzer() { //A lookup table so we don't have to calculate Rdistorted over and over //The values will be multiplied by focal length in pixels to //get the Rdistorted mFisheyeCorrect = new ArrayList(mFELimit); //i corresponds to Rundist/focalLengthInPixels * 1000 (to get integers) for (int i = 0; i < mFELimit; i++) { double result = Math.Sqrt(1 - 1 / Math.Sqrt(1.0 + (double)i * i / 1000000.0)) * 1.4142136; mFisheyeCorrect.Add(result); } } public Bitmap RemoveFisheye(ref Bitmap aImage, double aFocalLinPixels) { Bitmap correctedImage = new Bitmap(aImage.Width, aImage.Height); //The center points of the image double xc = aImage.Width / 2.0; double yc = aImage.Height / 2.0; Boolean xpos, ypos; //Move through the pixels in the corrected image; //set to corresponding pixels in distorted image for (int i = 0; i < correctedImage.Width; i++) { for (int j = 0; j < correctedImage.Height; j++) { //which quadrant are we in? xpos = i > xc; ypos = j > yc; //Find the distance from the center double xdif = i-xc; double ydif = j-yc; //The distance squared double Rusquare = xdif * xdif + ydif * ydif; //the angle from the center double theta = Math.Atan2(ydif, xdif); //find index for lookup table int index = (int)(Math.Sqrt(Rusquare) / aFocalLinPixels * 1000); if (index >= mFELimit) index = mFELimit - 1; //calculated Rdistorted double Rd = aFocalLinPixels * (double)mFisheyeCorrect[index] /mScaleFESize; //calculate x and y distances double xdelta = Math.Abs(Rd*Math.Cos(theta)); double ydelta = Math.Abs(Rd * Math.Sin(theta)); //convert to pixel coordinates int xd = (int)(xc + (xpos ? xdelta : -xdelta)); int yd = (int)(yc + (ypos ? ydelta : -ydelta)); xd = Math.Max(0, Math.Min(xd, aImage.Width-1)); yd = Math.Max(0, Math.Min(yd, aImage.Height-1)); //set the corrected pixel value from the distorted image correctedImage.SetPixel(i, j, aImage.GetPixel(xd, yd)); } } return correctedImage; } }

Barry Vant-Hull    06.06.2013

arrow_upward
3
arrow_downward

Я нашел этот pdf-файл и доказал, что математика верна (кроме строки vd = *xd**fv+v0 which should say vd = **yd**+fv+v0).

http://perception.inrialpes.fr/CAVA_Dataset/Site/files/Calibration_OpenCV.pdf

Он не использует все последние коэффициенты, доступные в OpenCV, но я уверен, что его можно довольно легко адаптировать.

double k1 = cameraIntrinsic.distortion[0]; double k2 = cameraIntrinsic.distortion[1]; double p1 = cameraIntrinsic.distortion[2]; double p2 = cameraIntrinsic.distortion[3]; double k3 = cameraIntrinsic.distortion[4]; double fu = cameraIntrinsic.focalLength[0]; double fv = cameraIntrinsic.focalLength[1]; double u0 = cameraIntrinsic.principalPoint[0]; double v0 = cameraIntrinsic.principalPoint[1]; double u, v; u = thisPoint->x; // the undistorted point v = thisPoint->y; double x = ( u - u0 )/fu; double y = ( v - v0 )/fv; double r2 = (x*x) + (y*y); double r4 = r2*r2; double cDist = 1 + (k1*r2) + (k2*r4); double xr = x*cDist; double yr = y*cDist; double a1 = 2*x*y; double a2 = r2 + (2*(x*x)); double a3 = r2 + (2*(y*y)); double dx = (a1*p1) + (a2*p2); double dy = (a3*p1) + (a1*p2); double xd = xr + dx; double yd = yr + dy; double ud = (xd*fu) + u0; double vd = (yd*fv) + v0; thisPoint->x = ud; // the distorted point thisPoint->y = vd;

Myke Smyth    16.08.2011

Программное исправление искажения «рыбий глаз»

Ответы (6)

Похожие вопросы