哈尔特征

✍ dations ◷ 2025-12-02 15:49:10 #生物识别技术,计算机视觉

哈尔特征(英语:Haar-like features)是用于物体识别的一种数字图像特征。它们因为与哈尔小波转换极为相似而得名,是第一种即时的人脸检测运算。

历史上,直接使用图像的强度(就是图像每一个像素点的RGB值)使得特征的计算强度很大。帕帕乔治奥等人提出可以使用基于哈尔小波的特征而不是图像强度 。维奥拉和琼斯进而提出了哈尔特征。哈尔特征使用检测窗口中指定位置的相邻矩形,计算每一个矩形的像素和并取其差值。然后用这些差值来对图像的子区域进行分类。

例如,当前有一个人脸图像集合。通过观察可以发现,眼睛的颜色要比两颊的深。因此,用于人脸检测的哈尔特征是分别放置在眼睛和脸颊的两个相邻矩形。这些矩形的位置则通过类似于人脸图像的外接矩形的检测窗口进行定义。

在维奥拉-琼斯目标检测框架的检测阶段,一个与目标物体同样尺寸的检测窗口将在输入图像上滑动,在图像的每一个子区域都计算一个哈尔特征。然后这个差值会与一个预先计算好的阈值进行比较,将目标和非目标区分开来。因为这样的一个哈尔特征是一个弱分类器(它的检测正确率仅仅比随机猜测强一点点),为了达到一个可信的判断,就需要一大群这样的特征。在维奥拉-琼斯目标检测框架中,就会将这些哈尔特征组合成一个级联分类器,最终形成一个强分类群。

哈尔特征最主要的优势是它的计算非常快速。使用一个称为积分图的结构,任意尺寸的哈尔特征可以在常数时间内进行计算。

一个矩形哈尔特征可以定义为矩形中几个区域的像素和的差值,可以具有任意的位置和尺寸。这种特质也被称为2矩形特征()。 维奥拉和琼斯也定义了3矩形特征和4矩形特征。这个值表明了图像的特定区域的某些特性。每一个特征可以描述图像上特定特性的存在或不存在,比如边缘或者纹理的变化。例如,一个2-矩形特征可以表明一个边界位于一个亮区域和一个暗区域之间。

维奥拉和琼斯的一个重要贡献是使用积分图 。 积分图是一个二维矩形的查找表,与原始图像具有一样的尺寸。积分图的每一个元素是原始图像在对应位置左上角所有像素的和。这就使得在任意位置计算任意尺寸的矩形的像素和时,只需要进行四次查表:

其中点 A , B , C , D {\displaystyle A,B,C,D} 属于原始图像 I {\displaystyle I} ,如图所示。

每个哈尔特征的查找次数取决于它的定义。维奥拉和琼斯的2矩形特征需要六次查询,3矩形需要八次,而4矩形则需要九次。

兰哈切和梅迪 提出了倾斜的(45°)哈尔特征。这种对特征维度的扩充是为了提升对物体的检测。由于这些特征对一些物体的描述更为适合,这种扩充是有效的。例如,一个倾斜的特征可以描述一个倾斜45°的边缘。针对这种特征的计算,也提出了倾斜的积分图。

相关

  • 镀锌镀锌,是指在铁或钢表面上铺上金属锌的防锈(英语:Rustproofing)方法。锌是一种抗腐蚀性颇高的金属,能够把铁隔绝于氧气和水,令铁不能发生生锈所需的的化学反应;由于锌的金属活动性比
  • 系词系词(英语:copula、复数为copulas或copulae、英文简称:cop),又译为系动词、联系动词,在语言学上为表示用于与谓词(主语补语)链接一个句子之主词的字词,比如在一个句子"The sky is blu
  • 浪漫浪漫可以指:
  • 龟头包皮炎龟头包皮炎是一种同时发生在龟头和包皮上的炎症,常见于包茎的人类小儿身上,但狗、绵羊和牛也有患此病的可能性。
  • 自转轴转动,是指物件旋转的运动。三维物件绕着旋转的轴称为转动轴或旋转轴,若旋转轴通过物体的质心,则称此物体在自转,而此轴称为自转轴。恒星和行星都会自转,小天体亦大多会自转。作为
  • 国家博物馆国家博物馆是由国家进行维护的博物馆。以下是国家博物馆的列表。
  • 两浙东路两浙东路是两宋时期设置的一个路。
  • 汉族地区佛教全国重点寺院本条目所列为源自1983年4月9日中华人民共和国国务院批转《国务院宗教事务局关于确定汉族地区佛道教全国重点寺观的报告》,附件所列中国汉族地区佛教全国重点寺院名单,均为中国
  • 龙潭运动公园龙潭运动公园是位于台湾桃园市龙潭区的一座公园。龙潭运动公园为1974年时龙潭乡城市规划时所规划,于1997年兴建完成,历经多次整修成为多功能运动公园(当前设计为2002年完工图样
  • 鹤龙力三郎鹤竜力三郎(日语:鶴竜 力三郎/かくりゅう りきさぶろう ),本名马纳恩加加拉文·阿纳德(蒙古语:Мангалжалавын Ананд,拉丁转写:Mangaljalavyn Anand,1985年8月10日-),