维奥拉-琼斯目标检测框架

✍ dations ◷ 2025-04-26 13:12:39 #生物识别技术

维奥拉-琼斯目标检测框架(英语:Viola–Jones object detection framework)是第一种可以实时处理并给出很好的物体检出率的物体检测的方法,由保罗·维奥拉和迈克尔·琼斯于2001年提出。值得一提的是,提出该方法的论文于2011年的CVPR会议上评为。虽然它可以被训练来寻找多种物体,它的主要应用还是在解决人脸检测方面。这个方法在OpenCV中被实现为cvHaarDetectObjects()。

检测框架使用的特征涉及到图像上矩形区域的像素和,就是哈尔特征,而这些特征以前多用于基于图像的物体检测领域。然而,由于维奥拉和琼斯使用的特征包含不止一个矩形区域,就显得更为复杂。右边的图像是四种不同的特征。每一个特征的值就是白色矩形的像素值之和与深色矩形像素值之和的差值。所以,相比那些复杂的方向可变滤波器(steerable filters),这种矩形特征是十分原始的。虽然他们对水平和竖直方向比较敏感,它们的反馈是比较粗粒度的。最后,使用一个称为积分图的数据结构,矩形特征的计算可以在常数时间内完成,也就使得它们很具有速度优势。例如,2矩形特征需要六次查询,3矩形特征需要八次,而4矩形特征则需要九次。

选择哪些特征作为最终用于分类的过程十分漫长。例如,在一个24x24像素的窗口内,一共有45,396个可能的特征。因此,目标检测框架使用了一个称为AdaBoost的机器学习算法来选择特征并训练分类器。

在学习阶段强分类器的进化可以很快完成,但是还不够进行实时计算。基于这个原因,强分类器按照复杂性的顺序被组成一种级联结构,每一个后续分类器的训练样本都是通过了之前所有分类器的样本。如果级联的任何一个分类器拒绝了一个检测窗口,则该窗口不再进行任何的进一步检测。因此,这种级联结构类似于一种退化的树。在人脸检测中,第一级分类器(也称为attentional operator)只使用了2个特征,就达到了将近0%的漏检率(false negative rate)以及40%的误检率(false positive rate)。这一个分类器就可以简单的过滤掉要检测窗口的一半。

这个级联结构对每一个分类器的性能有着有趣的影响。由于每一个分类器是否使用完全取决于它的前驱,因此,整体的误检率是:

类似地,检测率(detection rate)是:

因此,对于每一个分类器的检测效果的要求是惊人的低。例如,对于一个32层的级联分类器,为了达到 10 6 {\displaystyle 10^{-6}} 的误检率,每一个分类器只需要达到65%的误检率。同时,为了满足系统的检测率,对于单个分类器的检测率要求很高。例如,为了达到整体90%的检测率,每一个分类器的检测率需要达到99.7%。

相关

  • 角膜角膜,是眼球最前方的透明多层组织,其作用为:角膜位于虹膜、瞳孔及前房前方,并为眼睛提供2/3的屈光力(角膜的屈光力是眼球中最强),进入眼球的光在经过角膜后,通过晶状体的折射,光线
  • 布列敦森林体系布雷顿森林体系(英语:Bretton Woods system)是1944年7月至1973年间,世界上大部分国家加入以美元作为国际货币中心的货币体系。布雷顿森林协定对各国就货币的兑换、国际收支的调
  • D细胞D细胞(Delta cells,亦可写作δ-cells或D cells)是一类可以分泌体抑素(somatostatin)的内分泌腺上皮细胞。D在胃、肠道,以及胰岛中都有分布。在人的胰岛中,D细胞遍布整个胰岛。与之
  • 肯定后件肯定后件(Affirming the consequent),是一种形式谬误,其形式如下:这种主张是无效的,也就是说,虽然1和2是真的,结论的3却是错误的。因为在1的地方,并没有声明P是唯一导致Q的原因。因此
  • 羧肽酶.mw-parser-output ruby>rt,.mw-parser-output ruby>rtc{font-feature-settings:"ruby"1}.mw-parser-output ruby.large{font-size:250%}.mw-parser-output ruby.larger{fon
  • 包含体包涵体(inclusion bodies),或包含体,是无定形的蛋白质的聚集,被膜所包围。细胞破碎后,包涵体呈颗粒状,致密,低速离心就可以沉淀。包涵体难溶于水中,在变性剂溶液(如盐酸胍、脲)中才能溶
  • 圣巴巴拉加大加州大学圣巴巴拉分校(英语:University of California, Santa Barbara,简称UCSB,又常被译作圣巴巴拉加州大学),是一所著名的公立研究型大学,加州大学系统的成员之一。学校坐落在位
  • 安吉丽娜国家森林安吉丽娜国家森林(英语:Angelina National Forest)是美国的一处国家森林,位处得克萨斯州东部圣奥古斯丁县、安杰利纳县、杰斯帕县与纳科多奇斯县,占地面积约153.18 × 103英亩(61
  • 卡特里娜·斯维特卡特里娜·斯维特(英语:Katrina Swett)生于1955年10月8日,是兰托斯人权和正义基金会主席(Lantos Foundation for Human Rights and Justice)。 她还是一名美国教育工作者,2012年至2
  • 奇洞站奇洞站(朝鲜语:기동역/奇洞驛  */?)曾为韩国铁路长项线上的一个车站,位于忠清南道舒川郡锺川面,已于1945年废止。