图书扫描中心

✍ dations ◷ 2025-05-15 16:00:42 #图书扫描中心
图书扫描是一种透过图像扫描将实体的书转换成数位影像或电子图书(e-books)的过程。这种方法比重新输入所有文案快很多。在图书扫描还没可行前,重新键入文章是一般的唯一选择。 一本书一旦被数位扫描后,此图像即可供快速地传播、复制和视窗浏览。这类经扫描后的图像通常存放成DjVu图片档案、PDF格式或TIFF格式。一个以光学器材(例如:扫描仪、数码相机…)将文字以图像方式输入至电脑,再加以辨识还原成文字的技术(OCR)可以赚取更多利益,大大减少了储存书籍所需的空间和允许文案可重新编排、搜寻或用作输入文本处理应用,例如自然语言处理。商业图书扫描仪器的方式不像正常的扫描器,这些图书扫描仪器通常是一种有两侧光源的高素质数码相机,并装在某种形状的框架上,好让人或机器方便翻这本书。一些书籍需要V形的托架,提供支助书脊并且自动地将书本置于中心。相较于高架扫描器的生产力,速度快为此类型扫描器的优势。相较于价格通常从1万美元起跳的传统高架扫描器,此类型的数码相机图书扫描仪器更加符合成本效益。大规模组织的图书扫描例如有“古腾堡计划”英文电子书网站、Google图书搜寻、和“开放内容联盟”。其中最主要的挑战就是预计将有数以千万的书籍必须被扫描。所有书籍必须扫描,成为一个“普世图书馆”(universal library)供全球无数人于网络搜寻检索。目前为止有三种大型组织依靠的主要方法:外包、在室内扫描使用商业图书扫描仪器,以及在室内扫描使用自动扫描解决方案。至于外包,书籍经常是扫描完以便宜的价格从印度或中国船运而来。或者,基于便利、安全以及技术改良,许多组织选择在室内扫描,不是用耗时的高架扫描器,就是用数码相机式的扫描方法会快很多,而且这个方法跟Google的网络数据库一样好。传统方法是包含切割书籍的书脊,和在一台有自动输送页数能力功能的扫描机扫描每一页,并且在扫描完后重新装定零散的页数。一旦扫描完后,资料不是手动就是经由OCR的输入,另一项主要的花费就是书籍扫描计划。由于有版权争议,大部分的扫描书籍都没有版权,然而,Google图书搜寻所扫描的书仍然在版权保护下,除非出版者特别的排除。为了让书籍扫描维持在低预算,扫描书籍或杂志最低成本的方法就是切除装订。这种把书籍或杂志转换成一捆活叶式的纸张,可以被装载至一个标准的自动文件供给装置和利用低成本及一般的扫描技术来扫描。然而这对很老的书和稀有的书绝对不是一个理想的好方法,这对于书籍和杂志的扫描是一个很好用的工具,在书籍不是很贵重的收藏品之下,作为扫描内容的替代者很简单。用这种方法的过程会遇到两样技术性的困难,第一就是切除的部分,第二则是扫描的部分。延著一个方向裁切一叠500到1000页的文件最好的方法就是用裁切机。这是一个有着纸老虎钳的大钢桌旋拧下来至成堆的书堆,裁切前要确实的扣牢。裁切的完成是利用一个尖锐的大钢叶片直直向下同时裁掉整堆文件。 叶片上的控制杆容许使用数百磅的力来达到快速的一次裁切。想要干净俐落的切穿厚厚的一叠纸堆不能用传统廉价的镰状铰链裁纸机。这种裁切机是给较薄的纸堆用,实际上最多只能到10堆的限制。一堆大叠的纸张利用在铰链上扭转的力,拉扯叶片远离桌子尖端。切口变的较不确定当切口远离铰链,而力道需要控制叶片在切口边缘以增加切口移动远离铰链。裁切机在裁切的过程随着使用次数变多叶片会变钝所以必须要重新磨尖。上涂料的纸像是光滑的杂志会比平坦的书籍更加迅速的弄钝叶片,因为有高岭石粘土包覆。此外,切割精装版书籍会造成过度的磨损,因为是切穿精装版书籍的背衬。反而去除外层包装书堆内部纸的边缘会被切开。文章从书脊被拆开后,传统的平台扫描器只能单次扫描一张。然而这样的方式非常缓慢和辛苦。使用自动的扫描器(ADF)能使扫描文件便的更加容易。某些类型的书由于有边缘的装饰或者边缘有弧度,在使用自动的扫描仪会造成困难。ADF是特别用来扫描相同形状和大小,因此不符合这种标准类型的书会导致无法预期的错误扫描。由于这些书的边缘不一,在被拆开之前会以裁切器将其边缘裁切平顺。上涂料的杂志纸面与教科书太光滑使他们难以在自动文件配给装置的滚柱上被拾起和引导到纸的路径,ADF采用了一系列滚柱及途径来快速翻动纸张,放至机器中有可能会阻塞而导致错误。一般来说,只要尽量用直线的纸张路径少弯曲、曲线的话不太会出问题。粘土经过多次使用也会被抹掉且覆盖黏黏的东西在滚轮上。ADF滚柱可能需要定期清理以防止使用过度而滑动。杂志可能会造成大量扫描的问题点,由于一些纸张不均匀的堆叠,如杂志订阅卡和褶皱的内页。这些需要在拆除前开始批量扫描,如果有价值的内容会被单独扫描,或者是被排除在扫描过程之外。近年来,软件驱动的机器和机器人已发展到扫描书籍,而没有解散他们的需要,以维护资料的内容和它目前状态的数字化图片档案。最近的趋势是,不断改进成像技术,可使那些很少或几乎没有损坏的稀少以及脆弱的书籍,在很短的时间内被存取为高品质的数字图档。一些高端扫描系统采用真空、空气、滚轮,和静电,同时又是影像自动执行,通常是从放在可调整的V型支架高分辨率摄影机中产生。图像穿梭的成像设备使各种编辑可以进一步处理图像,无论是档案的文件,如TIFF或JPEG格式2000或网页的输出,如JPEG或PDF文件。依据中华民国著作权法第三条“重制:指以……其他方法直接、间接、永久或暂时之重复制作”,故图书扫描属重制行为。

相关

  • 凝血因子血液凝固,或称为凝血指的是血液由液体状态转变为不流动的凝胶状态的过程,是生理性止血的重要环节。血液凝固的实质就是血浆中的可溶性纤维蛋白原变成不可溶的纤维蛋白的过程。
  • 绿藻门绿藻门(学名:Chlorophyta)是植物中的一门,包含有约8000个物种。和陆生植物 (苔藓植物和维管植物)一样,绿藻也含有叶绿素 a 和 c ,且将能源转化为淀粉存在其色素体内。绿藻门和轮藻门
  • 肉桂酸肉桂酸(英语:Cinnamic acid,IUPAC名:(E)-3-苯基-2-丙烯酸),分子式为C6H5CHCHCOOH。是微溶于水的白色结晶化合物。归类为不饱和羧酸,它天然存在于许多植物。它易溶于许多有机溶剂。
  • 第一次接触第一次接触(First Contact)在科幻作品中是指人类和外星生物初次接触,或是遇到其他有高智能种族的情况。题材时常运用在人类学的第一次接触的情况,例如仇外、超验主义和自然语言
  • 土壤结构土壤结构是指不同大小的土壤颗粒、团聚体和孔隙在空间上的有机组合形式。土壤结构决定了水、气、热和养分在土壤中的蓄存能力和传输能力,是土壤肥力的物质基础。但是土壤结构
  • 平原平原(英语:plain)是海拔较低的平坦的广大地区,海拔多在0—500米,一般都在沿海地区。海拔0—200米的叫低平原,201—500米的叫高平原。冲积平原、海蚀平原、冰碛平原、冰蚀平原、堆
  • 罗刹罗刹(梵语:राक्षस,转写:Rākṣasa,巴利语:Rakkhasa),又作罗刹姿、罗叉娑、罗刹娑、罗乞察娑、阿落刹娑等,意译为可畏、速疾鬼、护者。罗刹女称罗叉私、罗刹斯(梵语:Rākṣasī)。
  • OFsub2/sub二氟化氧是化学式为OF2的化合物,结构与水分子相似,但化学性质非常不同,是强氧化剂。将氟气通入氢氧化钠溶液中,可得二氟化氧。二氟化氧中的氧具有不寻常的+2氧化态 具有强氧化性
  • 纽伦堡法案纳粹集中营转移营比利时:布伦东克堡垒 · 梅赫伦转移营法国:居尔集中营 · 德朗西集中营意大利:波尔查诺转移营荷兰:阿默斯福特集中营 · 韦斯特博克转移营挪威:法斯塔德集中营部
  • 退伍军人美国退伍军人事务部长是美国退伍军人事务部的主管,它在美国内阁中排名第17位。当美国退伍军人事务部长空缺时,由美国退伍军人事务部副部长接替,直到总统任命新部长为止,现任部长