首页 >
光学字符识别
✍ dations ◷ 2025-08-02 20:44:31 #光学字符识别
光学字符识别(英语:Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。对于不同的图像格式,有着不同的存储格式、不同的压缩方式,当前有OpenCV、CxImage等。如今数码摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,较为不适用于OCR技术。对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地进行OCR相关计算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。二值化也可以简单地将其理解为“黑白化”。对于不同的图像,噪点的定义可能不同,根据噪点的特征进行去噪的过程,称为降噪。由于一般用户,在拍照文档时,难以拍摄得完全符合水平平齐与竖直平齐,因此拍照出来的图片不可避免的产生倾斜,这就需要图像处理软件进行校正。将文档图片分段落,分行的过程称为版面分析,由于实际文档的多样性、复杂性,此步骤当前仍待优化。由于拍照、书写条件的限制,经常造成字符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。因此需要进行字符切割,即:将不同字符之间分割开。早期已模板匹配为主,后期以特征提取为主。由于文字的位移、笔画的粗细、断笔、粘连、旋转等因素的影响,极大地影响特征提取难度。人们希望识别后的文字,仍然像原始文档图片那样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程称为版面还原。根据特定的语言上下文的关系,对识别结果进行校正。将识别出的字符以某一格式的文本输出。OCR的概念是在1929年由德国科学家Tausheck最先提出来,并申请了专利。后来美国科学家Handel也提出了利用技术对文字进行识别的想法。中国最早的OCR商业应用是由科学家王庆人教授在南开大学开发出来的,并在美国市场投入商业使用。日本在20世纪60年代开始研究OCR识别理论,开发了邮政编码识别系统。
相关
- 职业性职业病是是指企业、事业单位和个体经济组织等用人单位的劳动者在职业活动中,因接触粉尘、放射性物质和其他有毒、有害因素而引起的疾病。这一概念不仅限于生产性质的企业,也包
- Ibuprofen布洛芬(英语:Ibuprofen,商品名:芬必得、普罗芬),是一种非类固醇消炎药(NSAID),用来止痛,退烧和消炎。可用于治疗经痛、偏头痛,和类风湿性关节炎。大约60%的人在使用任意一种NSAID后症状
- 真菌病毒真菌病毒(Mycovirus, Mycophage)泛指可以感染真菌的病毒。多数真菌病毒都属于双股RNA病毒(英语:Double-stranded RNA viruses),但也有约三成属于正义单链RNA病毒。真菌病毒必须具
- 膜增生性肾小球肾炎膜增生性肾小球肾炎(Membranoproliferative glomerulonephritis,MPGN),也被称为系膜毛细管性肾小球肾炎(mesangiocapillary glomerulonephritis), 是一种类型的肾小球肾炎引起的肾
- 不列颠尼亚不列颠尼亚(英文:Britannia)是罗马帝国对不列颠岛的拉丁语称呼,后据此设立不列颠尼亚行省。这一拉丁语称谓,后又衍生出守护不列颠岛的女神名称。若以读音论,实以“不列塔尼亚”最
- 子痫子痫(拉丁语:Eclampsia)是指孕妇因为妊娠毒血症而产生的癫痫症状。妊娠毒血症是在妊娠期间的疾病,其症状为高血压、蛋白尿或其他器官功能的异常。子痫可能会在分娩前、分娩中或
- 四方晶系四方晶系,也叫正方晶系,它具有一个4次对称轴,该轴是晶体的直立对称轴C轴,另外两个水平对称轴和C轴相互垂直相交。轴角α=β=γ=90°,轴单位a=b≠c。
- 盎格鲁街盎格鲁街(Promenade des Anglais,意为“英国人步行道”)是法国东南部城市尼斯一条沿着地中海蔚蓝海岸的著名的海滨步行道。在尼斯城市化以前,尼斯海岸还只是一片荒芜的海滩,被大
- 罗斯欧文·罗斯(Irwin Rose,1926年7月16日-2015年6月2日),美国生物化学家。由于发现了泛素调解的蛋白质降解,与阿龙·切哈诺沃、阿夫拉姆·赫什科一起获得了2004年诺贝尔化学奖。欧文
- Bisub2/subOsub3/sub三氧化二铋是一种无机化合物,化学式为Bi2O3,是铋最重要的化合物之一,虽然三氧化二铋可以从天然的铋华(一种矿物)取得,但是它主要的来源通常是炼铜或铅时的副产物,或直接燃烧铋(蓝色