数据化

✍ dations ◷ 2025-04-04 07:37:30 #数据化
数据化是将均匀、连续的数字比特结构化和颗粒化,形成标准化的、开放的、非线性的、通用的数据对象,并基于不同形态与类别的数据对象,实现相关应用,开展相关活动。数据化是中文中独有的一个重要概念,它是在电子化、信息化、计算机化和网络化等术语之间自然出现的。在很多地方,数据化的概念经常被与量化、数值化的概念相混淆,但实际上在这里,数据不是指狭义的数量值,而是指可以对应于各种信息对象的,数字比特的结构化集合。数据化和数字化不是对立的。数据化这一概念的提出不是对数字化的否定,而是对数字化的拓展与推进。数据化关注的焦点更多地集中在数字比特更复杂、更高级的存在形态上。数据化基于由数字比特组合形成的客体——数据。数据是所有数字比特对象的子集,数据化是数字化进程中的一个方向。数据化是内生于数字化的,就像半导体化内生于电子化,就像“数字的”内生于“模拟的”,就像活字印刷术内生于印刷术。在人类文明史中,活字印刷取代印刷术发展早期的雕版印刷,将中文里的汉字、英文里的字母和单词分离出来,成为可以自由组合的、在各种具体的文本中通用的独立颗粒,这一拓展革命性地提升了印刷的效率,导致了印刷成本的大幅度降低。在早期印刷术发展的基础上,活字印刷这一伟大发明带给我们更多灵活性,更大的选择空间,推动了社会中知识的传播与普及,加速了人类文明的进程。而数据化的文化意义和社会价值正是与它非常相似的。在电子化的时代,从“模拟的”转向“数字的”是一个巨大的飞跃。数字化是通过对连续时空对象进行离散化实现的。数字化对应的基本单元是比特(bits),数据化对应的典型对象则是字节(bytes)和字(words)。其他基本的数据类型还有布尔、双字、整型、浮点型等,而复合的数据类型则有数组、结构、枚举、联合等等。对应于通讯、计算与存储等具体应用,我们有复杂的高级数据对象,它们是数据包(packet)、类(class)和文件(file)等。

相关

  • 假阴性第一型及第二型错误(英语:Type I error & Type II error)或型一错误及型二错误为统计学中推论统计学的名词。在假设检验中,有一种假设称为“零假设(虚无假设)”;假设检验的目的是利
  • 脱发脱发,又称为脱发、掉发,指的是毛发从头部或是身体上掉落,一般来说至少会包含头发的脱落,其严重程度可以从一个小范围,乃至全身受影响。一般来说不会伴随发炎或出现疤痕。正常人的
  • 数码印刷数码印刷是指从数字的图像直接印刷成各种媒体的方法。它通常指的是包括以桌面出版进行短版印刷的专业印刷和其他数字源使用大幅面以及高产量的激光或喷墨打印机打印。数字印
  • 二苯基乙二酮二苯基乙二酮,也称联苯甲酰、苯偶酰、联苯酰、二苯酰,化学式为(C6H5CO)2,常缩写为(PhCO)2。属于二酮,用作有机合成的中间体。紫外光照射下,二苯基乙二酮裂解为自由基,引发聚合物链
  • 共同在生物学种系发生理论中,若两个或多个结构具有相同的祖先,则称它们同源(Homology)。这里相同的祖先既可以指演化意义上的祖先,即两个结构由一个共同的祖先演化而来(在这个意义上,蝙
  • Folding@HomeFolding@home(简称FAH或F@h)是一个研究蛋白质折叠、误折、聚合及由此引起的相关疾病的分布式计算工程。由斯坦福大学化学系的潘德实验室(Pande Lab)主持,于2000年10月1日正式引导
  • 科顿·马瑟科顿·马瑟(英语:Cotton Mather;/ˈmæðər/ FRS,1663年2月12日-1728年2月13日)是美洲新英格兰地区的一位清教徒牧师、多产作家、小册子作家(英语:pamphleteer)与意见领袖,他于1681年
  • 引脚引脚,或称接脚或管脚,是指电子元件的末端露出部分(导线或焊接垫)。用于连接其他元件或进行探测和分析。如CPU等元件微小的引脚也称为针脚,通常下弯而成“丁”字形,便于同面包板等
  • 北京中日友好医院坐标:39°58′26″N 116°25′37″E / 39.973922°N 116.426915°E / 39.973922; 116.426915中日友好医院,简称中日医院,位于中国大陆北京市朝阳区和平里樱花园东街2号,是一所由
  • 急流急流是河流中河床坡度(英语:stream gradient)较陡峭的部分,可以分为1-8,1是最适合航行的,而8是河床坡度最陡的,会让水的速度增加,造成湍流。急流是水文学的现象,介于平顺流动的河流及