工业大数据

✍ dations ◷ 2025-04-04 06:55:23 #工业大数据

工业大数据(Industrial big data)是构成工业人工智能的重要元素,指由工业设备高速产生的大量数据,对应不同时间下的设备状态,是物联网中的讯息。此一词语在2012年随着工业4.0的概念而出现,也和信息技术行销流行的大数据有关,工业大数据也意味着工业设备产生的大量数据有其潜在的商业价值。工业大数据会配合工业互联网的技术,利用原始资料来支援管理上的决策,例如降低维护成本以及提升对客户的服务。

大数据是指大量、多变且快速产生的数据,需要新的科技来处理,以便于决策、知识探索以及制程的最佳化,这也称为大数据的3V(volume、variety、velocity)。有时也会加上第四个V,也就是资料真实性(veracity)此一特征,强调资料的品质及整合性。不过工业大数据还需要加上二个V。一个V是可见(visibility),意思是发现资产或是制程中一些未预期的事实,并且将不可见的知识转换为可见的价值,另一个V也就是价值(value),因为工业环境会面对的风险及冲击,工业大数据在分析上的准确性要求会远高于比社会媒体分析或是客户行为分析上的要求。

工业大数据的数据是由自动化设备及程序自动产生,而其环境及操作也是受到控制的,目的是让人为的介入降到最小,因此工业大数据的资料的结构化程度较高,彼此相关性也较高,会依发生时间顺序排列,也比较适合进行分析。不过即使设备机器都已经互相连线及网络化,工业大数据有以下的特点(Background、Broken、Bad-Quality,也称为3B)也会造成在分析时的挑战:

一般的大数据分析重点在挖掘到资料之间的相关性,以及捕捉到现象。不过工业大数据更着重于由现象中找出其背后的物理性根本原因。因此有效的工业大数据分析会比一般的大数据分析更需要特定领域的专业知识。

相较于一般的大数据分析,工业大数据着重资料的完整性更甚于巨量的资料。因为若要建构一个准确的资料驱动分析系统,必需从不同的工作条件上采集资料。因为通讯特性,以及资料来源的不同,系统中的资料是离散未同步的。因此在正式进行分析之前,预处理格外的重要,可以确保资料是完整、连续及同步的。

大数据分析的重点是资料挖掘及发现,因此巨量的资料可以弥补资料的品质不良。但在工业大数据中,各变数都有明确的物理意义,在建立分析系统时,资料完整性非常重要。品质不良的资料或是不正确的记录都会影响不同变数之间的关系,对于估测的准确性上有灾难式的冲击。

因此,单纯一般泛用大数据分析的技巧不一定可以应用在工业数据中。工业大数据需要更多的领域知识、分析系统机能的清楚定义,也需要在正确的时机将提取到的见解给正确的人,以产生较佳的决策。

因为自动化工业设备可以以极快的速度大量产生资料,所以要处理这些资料的公司,首先面临的就是储存及管理资料的基础架构。传统的商业智能主要专注于企业内部有结构的资料,依其固定出现的周期处理相关资讯,而工业大数据分析系统需要接近实时处理的分析,以及分析结果的视觉化。

第一个步骤是收集正确的资料,现代设备的自动化程度越来越高,可以由越来越多的感测器自动产生资料。识别其中设备状态有关的参数就格外的重要了,可以减少需要和集的资料,也让资料分析更加有效率及效果。

下一个步骤是建立资料管理系统,既可以处理大量资料,并且可以用接近实时的效率进行分析。为了可以快速的进行决策,资料储存、管理及处理需要进一步的整合。例如通用电气为了其许多的燃气涡轮发动机,建立了资料储存基础架构的原型。所发展的系统以内存资料网格(in-memory data grids,IMDG)为基础,已证实可以处理高速及大量的资料流,并且可以以近乎实时的方式来分析资料。他们认为这项技术展示了实现工业大数据管理基础架构的可行作法。随着这些设备越来越便宜,这类系统也会成为未来产业的中心及基础。

网宇实体系统(Cyber-physical system)是工业大数据中的核心技术,是在运算模型以及实际元件之间进行无缝整合的系统。网宇实体系统和传统的运作技术不同,网宇实体系统的决策要以设备状态的核心内容为其决策基础。包括连结、转换、网宇、认知及组态的5C架构意味着网宇实体系统着重在将原始资料转换成可以进行行动的资讯、有助于了解流程的内容、最终透过有良好资讯的决策来提升流程。提升后的流程会进一步的提升生产力以及降低成本。网宇实体系统和工业大数据的使命(在大量的原始资料中找到相关见解,将资讯转换为价值)是一致的。网宇实体系统结合了资讯科技以及运营技术,创建资讯透明的环境,作为不同阶层用户的决策基础。

这类的技术已经有应用实例:美国国家科学基金会工业/大学智能维护系统协作研究中心(IMS)已在Cosen带锯机上实现此技术,而且2014年在芝加哥举行的IMTS中展示。IMS开发了适应性退化监控(Adaptive degradation monitoring)技术,来处理在切削过程产生的大量且高速的资料,以及负载变化的情形。当带锯退化条件出现时,会在最佳的时间建议使用者更换带锯,以确保安全,也减少在材料切削过程中造成的损失。所进行的分析计算是在云端进行,可以透过以太网以及行动设备存取。

工业系统的元件无时无刻都可以产生大量的资料。一个生产线上,每台机器每天都可以产生上亿笔的资料,例如波音787每次飞行就会产生500 Gigabyte的资料。明显的,工业系统中的一组单元产生的资料量远超过传统方式的能力范围,因此在处理、管理及运算上都是挑战。

有许多研究者、公司主动参与了收集、组织及分析巨量工业资料的工作,其中有些资料若因为研究需要,已可以公开给大众。

NASA的资料存取库是工业大数据中最出名的资料存取库。其中的许多资料会用在预测式分析、故障侦测及预诊断(英语:prognostics)机能等。

相关

  • 女真文陶文 ‧ 甲骨文 ‧ 金文 ‧ 古文 ‧ 石鼓文籀文 ‧ 鸟虫书 ‧ 篆书(大篆 ‧  小篆)隶书 ‧ 楷书 ‧ 行书 ‧ 草书漆书 ‧  书法 ‧ 飞白书笔画 ‧ 
  • 乒乓球奥林匹克运动会乒乓球比赛,于1988年夏季奥林匹克运动会开始正式成为比赛之一,初时设男子单打、男子双打、女子单打及女子双打;但于2008年夏季奥林匹克运动会取消男子双打及女子
  • 丨部丨部,是为汉字索引中的部首之一,康熙字典214个部首中的第二个(一划的则为第二个)。就繁体和简体中文中,丨部归于一划部首。丨部只以中间为部字。且无其他部首可用者将部首归为丨
  • 赵德吉国赵德吉亦作赵得吉(1896年-1954年5月23日),山东莒南县人,中华人民共和国时期称帝者,1954年在山东莒南县称帝。莒南县十字路镇西芦家林村人赵德吉,1925年加入九宫道,任盘主。1941年后
  • 没有问题《没有问题》(朝鲜语:문제는 없다,英语:The Game With No Name)为韩国MBC综艺节目,由全炫茂主持,节目主轴为邀请嘉宾、明星与明星的家人一同进入神秘的游戏房间,进行解谜与逃出的过
  • 沙特阿拉伯航空沙特阿拉伯航空(阿拉伯语:السعودية‎;英语:Saudia),是沙特阿拉伯的国家航空公司,总部设于吉达及利雅德分部。沙特航空的主要枢纽是吉达的阿卜杜勒-阿齐兹国王国际机场,而其
  • 萧咸萧咸(前1世纪-2年),字仲,东海郡兰陵县(今山东兰陵县西南)人,迁居杜陵(今陕西西安东南)。西汉官员。萧望之之子,萧育、萧由的兄弟。萧咸初为丞相史,举茂材,为好畤令,转任淮阳国内史、泗水国内史,张掖郡、弘农郡、河东郡太守。在官有治绩,多次增秩赐金。后来免官,再任越骑校尉、护军都尉、中郎将,奉命出使匈奴。官至大司农。在官任上去世。
  • 朝水雷朝水雷(日语:朝水 れい/あさみず れい ,1997年9月30日-),日本前年少偶像、前写真偶像。于东京都出身。所属事务所为Lemon Grass(レモングラス)。朝水在2007年3月先后推出写真集《融化布丁》(めるてぃプリン)和写真DVD《漂亮☆雷》(ぷりてぃ☆れい),这两部作品皆有收录她身穿丁字裤的场面,她的母亲亦在DVD当中登场。一位负责写真杂志出版工作的业内人士因此怀疑“她母亲的脑袋是否有问题?”,并认为Lemon Grass这样的事务所只是在把孩子当作赚钱工具。她的写真DVD《来抱我吧》(だっこ
  • 威灵宫威灵宫可以指下列庙宇:
  • 雷蒂亚-罗曼语支雷蒂亚-罗曼语支 (Rhaeto-Romance languages) 属于印欧语系罗曼语族,通行于瑞士东南部及意大利东北部,得名于古罗马的雷蒂亚行省。雷蒂亚-罗曼语支包含三种语言: