1 引 言
在图像处理和计算机视觉研究中,对字符图像的识别是一个应用非常广泛的领域。如何对现实环境下的光学字符图像进行自动识别,如何正确提取字符(尤其是汉字)的特征成为是否能识别成功的重要因素。目前国内已有功能较完善的扫描字符识别系统,这些软件多采用网络特征提取或模板匹配方法进行识别,在实验环境下对大多数结构稳定的字符或汉字的识别率较高,尤其对于正常字体的字符识别。但对实际的字符点阵进行识别时,字符点阵可能会变形、歪曲形成斜体字,这种斜体字会使属于同一类别样本间的差异增大,难以获得稳定的特征进行有效识别分类,识别率大大降低。
在以CCD摄像机为输入设备对自然环境中的字符图像进行实时识别的系统(如汽车车牌照自动识别系统)中该问题就更加突出。在这些系统中图像的获取一般是通过架设在通道上方及两旁的摄像机或人工手提式摄像机拍摄得到,由于拍摄距离、拍摄角度等原因使字符图形存在一定程度的倾斜,这样会造成单字切分的不准确甚至错误,从而进一步造成字符的误识别。为了确保系统的正确识别率,有必要对字符图像区域进行变形几何校正。
所谓图像校正是指从具有畸变的图像中消除畸变的处理过程,消除几何畸变的叫几何校正。在实际运用中字符图像的畸变一般是由于输入设备姿态位置变化而导致获取的图像产生缩放、旋转等几何畸变,分析这些畸变不难发现他们都可以用原始图像坐标与畸变图像坐标之间的关系来描述。因此消除几何畸变恢复原图像的问题就转化为从畸变图像和两坐标之间关系求得无几何失真的图像问题。在求取了坐标变换参数之后,几何畸变校正主要包括3个步
骤,即空间变换、灰度插值、平滑(毛刺剔除)。
2字符主方向的含意及求取
2.1 字符主方向的定义
为了实现对变形字符图像的预处理(变形矫正),必须确定变形字符图像有关的形变参数[1]。如图1(a)所示为一随机二值字符图像,也可以看作平面上的一个二维随机向量(X1,Y1),字符图像中的象素点即可作为二维随机向量(X1,Y1)的随机样本点来分析。为了方便起见,不防设二维随机向量(X1,Y1)服从均匀分布且相互独立,图像平面内的字符象素点总数为N,字符点坐标为(xi1,Yi1)其中0≤i≤N,则随机变量(X1,Y1)的数学期望为:

以字符图像中某一点为中心将图像旋转某一角度后,形成倾斜的字符图像,结果如图1(b)所示。这时倾斜字符图像的象素可以看作某一个新的二维随机向量(X2,Y2)的随机样本点。很明显,字符图像的字符象素点总数不变仍为N,随机样本点坐标变换为(xi2,yi2),0≤i≤N,则随机变量(X2,y2)的数学期望也随之发展变化为:
![]() |

由式(3)可知,无论图像如何旋转,随机样本方差均保持不变,即两个独立随机变量X,Y各自方差的和不变,但随机变量X,Y各自方差D(X),D(Y)在总的随机样本方差D(X,Y)中的比重却在变化。
为了方便分析随机变量X,Y在随机样本方差中的比重,本文定义了一个字符主方向判别函数:

当字符图像围绕某一点旋转时,判别函数f(X',y')周期性变化,由图1(a)可知,当图像中字符沿X轴方向书写时,判别函数f(X',Y')达到最大值。因此对某一倾斜字符图像的坐标进行旋转,使判别函数达到最大,这时X'轴所指方向被称为字符主方向,他对应于字符图像中字符书写方向。
2.2 主方向搜索策略
一般由于图像输入设备姿态位置变化造成的几何倾斜其范围在-π/4~π/4之间,所以对字符主方向的搜索方案可采用逐角度旋转式,这样对于几何倾斜范围在-π/4~π/4之间的字符图像,若最小角度分辩率为△θ,则搜索次数为π/2△θ。这种搜索策略的优点在于他思路简单,且可以方便检测出搜索范围内的最大值,当然他的缺点也是很明显的,即花费搜索时间太多。
分析如图1(b)所示的字符图像,当图中字符围绕图中某一点旋转时,随机字符点阵在z坐标上投影的方差是旋转角度θ的一维函数。当字符图像的主方向在搜索范围一π/4~π/4之间时,该一维函数将出现一次最大值且在搜索范围内呈单峰特性分布,对图1(b)所示的倾斜字符图像在-π/4~π/4的范围内求取判别函数曲线如图2所示。
![]() |
3基于主方向的快速校正算法
3.1 变形校正算法
通过对字符主方向的定义可看出字符主方向就是图像中字符的主要书写方向,也是使判别函数达到最大时X'轴所指方向。如果将字符图像旋转使X'轴所指方向与水平轴重合,则校正了图像在该方向上的变形[1,2]。
图3(a)为一发生几何形变的字符图像示意(为分析直观,本文用一平行四边形框代表发生扭曲的字符图像)。对如图3(a)所示的字符图像求取字符主方向,并旋转直角坐标直至X轴与字符主方向重合,从而校正了图像在字符书写方向上的变形(校正效果如图3(b)所示)。
![]() |
对图3(b)主方向校正效果进行观察,我们发现通过字符主方向校正图像的主要形变已得到了校正。但进一步分析得知,由于在实际几何变形情况下,发生在X轴与y轴方向上的形变角度不一定相等,所以经过主方向旋转校正后,字符图像只校正了发生在字符书写方向上的变形,而单个字符自身的扭曲却并没有得到校正。
因此,本文的算法对变形的字符图像采取了分步校正处理的思路。首先在-π/4~π/4的范围求取字符图像的主方向,并通过旋转图像坐标达到校正图像主方向上的形变;然后根据求取主方向的基本原理在π/4~3π/4的范围求取字符水平扭曲角度,将图像在水平方向进行相同角度的扭曲从而达到校正的效果(如图3(c)所示)。在这里必须指明求取扭曲角度与主方向是有差别的,求取主方向时是将字符图像以某一点为中心进行旋转而求取字符水平变形角度是将字符图像进行水平扭曲。
3.2 平滑处理
在知道图像字符的主方向及水平变形角度后,即可采用空间变换公式,将畸变图像矫正(空间变换公式很多文章中都有介绍[2,3],本文就不再说明了)。但是由于在变换过程中不可避免将采用插值运算,将会出现很多的毛刺点,为此需要对矫正后的二值图像进行平滑处理[4]。本文对不同情况下的黑色噪点及白色噪点进行剃除。设图像中的任意一点为xi,j,如图4所示:其8邻居分别为xi,j-1,xi+1,j-1,xi+1,j,xi+1,j+1,xi,j+1,xi-1,j+1,xi-1,j和xi-1,j-1。
设二值图像中象素xi,j为黑点时其值为1,为白点时其值为0,则可用如下两个逻辑代数式进行计算,得到处理后的象素值x'i,j。其中式(5)的实质是:对于被黑点包围或半包围的白色点(如图4(a)所示),则置该点为黑点。
式(6)的主要功能是:对于黑色点,如果被白点包围或半包围(如图4(b)所示),则视之为噪声,应当将其剔除[5]。
4实例仿真
本文针对通过摄像机从实际环境中摄取的汽车车牌照图像及扫描的斜体字体进行几何校正实验,实际处理了300余幅字符图像。实验结果良好,这表明本文介绍的算法具有较强的适应性,同时该算法还具有运算速度快的特点。由于篇幅的限制,这里仅给出了两幅很有代表性的斜体字体图像和车牌图像。其结果分别如图5和图6所示。
![]() |
5 结 语
通过仿真实验表明,对发生形变的字符图像进行主字符方向的搜索来求取倾斜角并校正是一种行之有效的方法。同时该方法使用了较优化的快速搜索策略,可以大大减少计算时间。
该方法的一个缺陷:整个算法是建立在字符图像只发生水平或垂直扭曲和旋转形变的假设之上的,对因镜头畸变或其他原因造成的非几何畸变校正效果有限。