十个图像处理处理高频面试问题

总结十个图像处理处理高频面试问题。


图像特征 HOG LBP Haar

HOG特征

行人检测 HOG+SVM

在一副图像中,局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。

本质:梯度主要存在于边缘的地方

实现方法: 首先将图像分成小的连通区域,我们把它叫细胞单元。然后采集细胞单元中各像素点的梯度的或边缘的方向直方图。最后把这些直方图组合起来就可以构成特征描述器。

过程:

  1. 灰度化
  2. Gamma校正法,颜色空间归一化
  3. 计算每个像素的梯度
  4. 图像划分为小的cell
  5. cell的梯度直方图
  6. 几个cell组成一个block 一个block中所有cell的特征串联起来成为HOG特征
  7. 所有block的特征串联

把样本图像分割为若干个像素的单元(cell),把梯度方向平均划分为9个区间(bin),在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计,得到一个9维的特征向量,每相邻的4个单元构成一个块(block),把一个块内的特征向量联起来得到36维的特征向量,用块对样本图像进行扫描,扫描步长为一个单元。最后将所有块的特征串联起来,就得到了人体的特征。例如,对于64128的图像而言,每1616的像素组成一个cell,每22个cell组成一个块,因为每个cell有9个特征,所以每个块内有49=36个特征,以8个像素为步长,那么,水平方向将有7个扫描窗口,垂直方向将有15个扫描窗口。也就是说,64128的图片,总共有367*15=3780个特征。

LBP

流程:
以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数(通常转换为十进制数即LBP码,共256种),即得到该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息。

改进:

  • 圆形LBP
  • LBP旋转不变
  • LBP等价模式

Haar特征

Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。

Haar-like特征的计算—积分图

积分图主要的思想是将图像从起点开始到各个点所形成的矩形区域像素之和作为一个数组的元素保存在内存中,当要计算某个区域的像素和时可以直接索引数组的元素,不用重新计算这个区域的像素和,从而加快了计算(这有个相应的称呼,叫做动态规划算法)。积分图能够在多种尺度下,使用相同的时间(常数时间)来计算不同的特征,因此大大提高了检测速度。


边缘检测

Hough霍夫变换

我们知道,一条直线在直角坐标系下可以用y=kx+b表示, 霍夫变换的主要思想是将该方程的参数和变量交换,即用x,y作为已知量k,b作为变量坐标,所以直角坐标系下的直线y=kx+b在参数空间表示为点(k,b),而一个点(x1,y1)在直角坐标系下表示为一条直线y1=x1·k+b,其中(k,b)是该直线上的任意点。为了计算方便,我们将参数空间的坐标表示为极坐标下的γ和θ。因为同一条直线上的点对应的(γ,θ)是相同的,因此可以先将图片进行边缘检测,然后对图像上每一个非零像素点,在参数坐标下变换为一条直线,那么在直角坐标下属于同一条直线的点便在参数空间形成多条直线并内交于一点。因此可用该原理进行直线检测。

一阶微分算子:Roberts 、Sobel 、Prewitt

Roberts:
[1 0
0 -1]

Sobel:
[-1 -2 -1
0 0 0
1 2 1]

Prewitt:
[1 1 1
0 0 0
-1 -1 -1]

二阶导数算子

拉普拉斯Laplacian算子

拉普拉斯算子模板的基本要求是对应的中心像素的系数应是正的,对应中心像素邻近像素的系数应是负的,且系数总和为0.

马尔Marr算子

由于拉普拉斯算子对噪声敏感,为了减少噪声的影响,可在检测前先对图像平滑处理,再用拉普拉斯算子。由于一个给定像素点所对应场景点的周围点对该点的光强贡献呈高斯分布,所以可使用高斯加权函数作为平滑函数。将高斯加权平滑运算与拉普拉斯运算结合即是马尔边缘检测方法。

Canny算子

  1. 彩色图像转换为灰度图像
  2. 对图像进行高斯模糊
  3. 计算图像梯度,根据梯度计算图像边缘幅值与角度(这里其实用到了微分边缘检测算子来计算梯度幅值方向)
  4. 非最大信号压制处理(边缘细化)
  5. 双阈值边缘连接处理
  6. 二值化图像输出结果

仿射变换

仿射变换可以理解为
・对坐标进行放缩,旋转,平移后取得新坐标的值。
・经过对坐标轴的放缩,旋转,平移后原坐标在在新坐标领域中的值。

translate scale rotate shear reflect


直方图均衡化

  1. 各个灰度级别的出现频率 即灰度直方图
  2. 各个灰度的累计分布
  3. 累计分布 进行量化 rq(i)=ROUND(r(i)*15),(说明:量化公式中的15等于原始图像灰度级数减1)
  4. 按照量化后的对应关系,灰度值转换 即可
Author: Ykk
Link: https://ykksmile.top/posts/46360/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.