机读数据

✍ dations ◷ 2025-06-25 09:56:45 #机读数据

机读数据是指合符可由电脑处理格式的数据。机读数据必须是结构化数据。

在美国,2019年1月14日的OPEN政府数据法案(英语:Foundations_for_Evidence-Based_Policymaking_Act)将机读数据定义为“一种格式,该格式可以由计算机轻松处理而无需人工干预,同时确保不丢失语义。”法律指示美国联邦机构以这种方式发布公共数据,确保“该机构的任何公共数据资产都是机读的”。

机读数据可分为两类:标记为人类可读的数据,以便机器也可以读取(例如,微格式,RDFa,HTML),以及主要用于机器处理的数据文件格式(CSV、RDF、XML、JSON)。需注意的是,仅当这些格式其中包含的数据经过正式结构化时,才是机读数据,而从结构不良的电子表格中导出CSV文件则不符合定义。

机读不是可数字访问(英文:digitally accessible)的同义词。可数字访问的文档可能在线上,使人类更易于透过电脑存取,但是如果内容不是机读的,则很难通过电脑编程逻辑来提取,转换和处理其内容。

可扩展标记语言(XML)被设计为可人类和机读的,可扩展样式表语言转换(XSLT)用于改善数据的呈现方式以提高人类可读性。例如,XSLT可用于自动呈现可移植文档格式(PDF)的XML。机读数据可以自动转换以提高可读性,但是通常来说,事实并非如此。

为了实施《政府绩效和结果法案(英语:Government Performance and Results Act)》(GPRA)现代化法案,美国行政管理和预算局(OMB)定义了“机读格式”,如下所示:“格式可以是标准计算机语言(非英语)。由网络浏览器或计算机系统自动读取(例如xml)。传统的文字处理文档和便携式文档格式(PDF)文件很容易被人类读取,但通常机器难以解释。其他格式,例如可扩展标记语言(XML),(JSON)或带有标题栏且可以导出为逗号分隔值(CSV)的电子表格是机读的格式。由于HTML是一种结构化标记语言,可以谨慎地标记文档的某些部分,因此计算机可以收集文档组件来组装目录 (书籍),大纲,文献检索书目等。可以使传统的文字处理文档和其他格式可以机读,但该文档必须包括增强的结构元素。”

相关

  • 讯号处理在计算机科学、药物分析、电子学等学科中,信号处理(英语:signal processing)是指对信号表示、变换、运算等进行处理的过程。信号处理可以用于沟通人类之间,或人与机器之间的联系;
  • 洗肾血液透析(英语:Hemodialysis),是将血液抽出体外,经过血液透析机的渗透膜,清除血液中的新陈代谢废物和杂质后,再将已净化的血液输送回体内,俗称“洗肾”及“洗血”。血液透析可用于肾
  • 平民 (古罗马)平民是古罗马时代罗马公民(不同于奴隶)中最大的群体。他们不同于更高阶层的贵族,在政治和经济上缺少权力。对他们适用的法律为《万民法》。并非所有平民都有土地。随着历史的发
  • 弹性硫弹性硫通常认为是硫在159℃(即硫的λ转变温度)以上,经过淬冷之后所得到的柔性产物,主要成分为普通的硫八环和聚合硫。但有文献指出,即便在λ转变之前(159℃之前),也可经由快速加压凝
  • 米歇尔角 (多米尼克)米歇尔角(Pointe Michel)是加勒比海岛国多米尼克圣卢克区唯一的一个城镇,也是该区的首府和最大城镇,位于该岛西南海岸,距离该国首都罗索以南5.5公里,2001年人口1,576人。该镇为多
  • 余洪耀余洪耀(1953年-),浙江人,中华人民共和国政治人物、外交官。2007年,接替高树茂,担任驻蒙古大使。2011年,由王小龙接任。2011年10月至2013年12月接替杨秀萍出任驻马尔代夫大使。
  • 蔡机功蔡机功(?-1684年),福建人,本为郑成功的麾下部属,期间因故离职,后于台湾清治时期初期发动民变。1683年,郑克塽投降清朝。1684年康熙帝钦定台湾归属福建管辖,台湾清治时期正式开始。为
  • 香蕉可丽饼香蕉可丽饼,也称香蕉松饼,香蕉可丽饼的基本材料是香蕉,奶油,牛油,牛奶,鸡蛋,中筋面粉和糖。1、先把鸡蛋搅拌均匀,然后加入糖,牛奶和中筋面粉搅拌成可丽饼浆。2、加热平底锅开,涂
  • 多迩具久多迩具久乃《古事记》记述之国神,可写成“谷蟆、谷蟆”,实则为日本蟾蜍。依《古事记》上卷之记载,大国主神在出云时,见一神明自波穗乘天之罗摩船(あめのかがみのふね)渡海而来,身上
  • 罗蒙诺索夫站罗蒙诺索夫站(俄语:Ломоно́совская,罗马化:Lomonosovskaya)是圣彼得堡地铁的一个车站。罗蒙诺索夫站开通于1970年12月21日,是圣彼得堡地铁3号线的一个车站。车站名