首页 >
OCR
✍ dations ◷ 2025-09-02 17:49:50 #OCR
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 信息系统信息系统或资讯系统(Information Systems),从技术上说就是为了支持组织决策和控制而收集(或获取)、处理、存储、分配信息的一组相互关系的组件。除了支持决策、协作和控制,信息系
- D细胞D细胞(Delta cells,亦可写作δ-cells或D cells)是一类可以分泌体抑素(somatostatin)的内分泌腺上皮细胞。D在胃、肠道,以及胰岛中都有分布。在人的胰岛中,D细胞遍布整个胰岛。与之
- 宾州多佛学区案美国宾夕法尼亚中部区域联邦法院United States District Court for the Middle District of Pennsylvania泰咪·奇兹米勒等人诉多佛学区等团体(Tammy Kitzmiller, et al. v.
- 电聚焦等电位聚焦(英语:Isoelectric focusing)是一种根据分子携带的电荷不同来分离分子的技术。等电位聚集通常在凝胶中进行。分子会被集中在一个具有pH梯度的介质中,通过介质的电流将
- ΠPi(大写Π,小写π,中文音译:派),是第十六个希腊字母。大写字母Π:小写字母π:西里尔字母的П及拉丁字母的P都是从Π变来。
- 伊弗雷姆·卡齐尔伊弗雷姆·卡齐尔(希伯来语: אפרים קציר,英语:Ephraim Katzir,1916年5月16日-2009年5月30日),以色列生物物理学家和以色列工党政治家。1973年至1978年担任以色列第四任
- 弗里敦弗里敦(英语:Freetown),是西非国家塞拉利昂共和国的首都,经济、文化中心,亦是该国的最大城市。位于大西洋岸边的弗里敦半岛(Freetown Peninsula),2004年人口有1,070,200人。它不仅是
- 丁基在有机化学中,丁基是一种含四个碳的烷基自由基或官能团,具有通用化学式-C4H9,从两个丁烷异构体中的任意一个衍生而来。异构体正丁烷(即直链烷烃)中的两个端基碳原子或中间的两个
- 王家骐王家骐(1940年2月-),男,江苏苏州人,中国光学仪器专家,中国科学院院士。王1963年毕业于哈尔滨工业大学金属材料系,1966年8月中国科学院长春光学精密机械研究所硕士研究生毕业,其后留校
- 愈伤组织愈伤组织(英语:Callus)是植物中由薄壁细胞组成且未形成特定结构的组织,通常出现于植物的伤口处。在研究中,可以使用灭菌后的植物组织样品(外植体)诱导愈伤组织形成,然后置于封闭的培