数据赋能
上QQ阅读APP看书,第一时间看更新

1.2.2 智能认知

数据赋能中的智能认知是指借助一系列将物理世界运行原理逻辑化、代码化的分析模型,对数据进行加工和处理,为智能行为的实现提供重要依据。

1.智能认知的常用技术

(1)统计分析。统计,顾名思义是将信息统括起来进行计算,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。统计分析是统计工作五个阶段(统计设计、资料收集、整理汇总、统计分析、信息反馈)中最关键的一步。如果缺少这一步或这一步做得不好,都将降低统计工作的效用。

(2)数据挖掘。数据挖掘(data mining)又称数据库中的知识发现(knowledge discovery in database,KDD),是目前人工智能和大数据领域研究的热点问题。所谓数据挖掘是指通过算法从大量的数据中找出隐藏于其中的信息和知识的过程。数据挖掘是一种决策支持过程,它主要基于机器学习、模式识别、统计学、数据库、可视化等技术,高度自动化地分析数据,做出归纳性推理,从中挖掘出潜在的模式。数据挖掘的常见应用有关联规则、分类、聚类等。

(3)深度学习。深度学习是机器学习的分支,是一种以人工神经网络为架构,对资料进行表征学习的算法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,将多层组织链接在一起,形成神经网络“大脑”进行精准复杂的处理,也就像人们识别物体、标注图片一样。深度学习是从机器学习中的人工神经网络发展出来的新领域。早期所谓的“深度”是指超过一层的神经网络。但随着深度学习的快速发展,其内涵已经超出了传统的多层神经网络,甚至机器学习的范畴,逐渐朝着人工智能的方向快速发展。

(4)数字仿真。数字仿真是通过将包含了确定性规律和完整机理的模型转化成软件的方式来模拟物理世界的一种技术。只要模型正确,并拥有完整的输入信息和环境数据,就可以基本正确地反映物理世界的特性和参数。如果说建模是模型化我们对物理世界或问题的理解,那么仿真就是验证和确认这种理解的正确性和有效性。所以,数字化模型的仿真技术是创建和运行数字孪生体、保证数字孪生体与对应物理实体实现有效闭环的核心技术。

(5)自然语言处理。自然语言处理主要针对词语、段落或篇章进行处理。主要的使用方法分别基于规则和统计两方面。基于规则的方法是根据语言相关的规则人工对文本数据进行处理;基于统计的方法是通过大规模的数据集统计分析,最终实现对文本数据的处理。数据集的好坏对自然语言处理模型的性能有着很大影响。所以,只有拥有强大的数据支撑,才可以更好地对文本进行进一步的处理和分析。基于中文的自然语言处理主要研究的内容包括分词、词性标注、词义消歧、文本分类和语言建模等[1]

2.智能认知的三大功能

(1)描述。描述是指从数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程,如车间运行状态可视化、销售数据可视化等。在第四次工业革命和数字经济的大背景下,信息化与智能化蓬勃发展,带动了制造系统由原来的能量驱动向数据驱动转变,实现生产过程工艺智能优化和过程合规智能管理,“黑灯工厂”“无人工厂”越来越成为智能制造的发展趋势,制造车间的数据智能化描述至关重要。

例如,广州白云电器设备股份有限公司(以下简称“白云电器”)在广州神山基地的的“数字化工厂”,采用了自动化制造流程,配备智能生产实时状态监控系统(见图1-12),大部分生产运作都不需要人工参与,通过智能制造技术,将制造过程中物料、设备、产品和环境等信息集成到数据看板中,供工厂控制人员统一协调、优化配置。据白云电气集团有限公司(以下简称“白云电气集团”)董事长助理程咏斌现场向我们介绍,这间单体建筑的数字工厂,由于采用了数据赋能技术,可以实现规模化柔性制造,生产效率得到显著提高,投产后每年的产值达到30亿元。

图1-12 白云电器“数字化工厂”数据看板

资料来源:本书作者调研时拍摄。

(2)诊断。诊断是指从描述中知道“是什么”后,解释为什么会发生,分析事物之间的关联关系、发展模式等,解释特定现象发生的原因。其核心工作是建立数据之间的联系,从而理解数据之间的因果关系,最终为特定的业务或事件找到驱动因素或诱因,如故障诊断、故障定位等。例如,日立集团医疗健康事业部从20世纪90年代中期开始,利用IoT/M2M系统为设备的各种感应器数据设定阈值,之后由技术人员观察数据变化,并判断是否需要维护以及确定零件更换时间。这种故障预测方法需要技术人员依据经验判断,而日立医疗健康事业部在全世界运营中的医疗设备有上千种,技术人员很难精确地监测所有的设备。为解决此问题,日立医疗健康事业部构建了故障预兆诊断服务系统,累积了大量感应器数据,委托研究所利用大数据分析软件,按照趋势分析的方法对数据进行归类和分析,进而构建故障成因模型,形成独有的群集分析诊断算法,实现远距离诊断设备状态,提前检测出导致故障发生的状态变化和异常情况。日立医疗健康事业部运用故障预兆诊断服务系统后,设备因故障而无法使用的时间减少了16.3%,提高了医院的医疗水平,降低了设备故障成本[2]

(3)预测。预测是指解释将会发生什么,判断事件未来发生的可能性,如设备剩余寿命预测、故障预测、销量预测等。智能制造的核心领域之一是基于历史大数据和领域经验知识,采集实时生产数据,实现生产要素的建模,根据模型评估相关风险因素,预测生产过程中产品质量与加工设备等的下一状态,将预测值与目标设定值实时比较,并通过对关键制造数据的科学调优,最终实现车间绩效的优化[3]。例如,美国通用电气公司在其工业互联网平台Predix上利用数字孪生技术,对飞机发动机进行实时监控、故障检测和预测性维护。应用程序根据数字孪生不断比较实际数据和预测数据。例如,将实际刹车片温度与刹车片温度阈值进行比较,记录偏离正常阈值的刹车片,以便安排主动维护[4]。再如,特斯拉公司为其生产和销售的每一辆电动汽车都建立了数字孪生模型。每辆电动车每天报告其日常数据,通过数字孪生的模拟程序使用这些数据来发现可能存在的异常情况并及时采取纠正措施。通过数字孪生模型,特斯拉每天可获得相当于160万英里(1英里=1 609米)的驾驶体验,并在不断的学习过程中反馈给每辆车[5]

[1] 何铠 . 基于自然语言处理的文本分类研究与应用 [D]. 南京:南京邮电大学,2020.

[2] 日立集团 . 运用长期经验和先进分析技术进行“医疗设备故障预兆诊断”[EB/OL].(2017-03)[2021-02-05]. https://social-innovation.hitachi/zh-tw/case_studies/mri_ predictive_maintenance/.

[3] 陶飞,程颖,程江峰,等. 数字孪生车间信息物理融合理论与技术[J]. 计算机集成制造系统,2017,23(08):1603-1611.

[4] 树根互联 . 一图读懂:如何利用数字孪生帮助企业创造价值 [EB/OL]. (2020-07-30)[2021-01-25]. https://mp.weixin.qq.com/s/mXu7xGstCIhWQVwgTvruWg.

[5] 德勤 . 德勤中国智能制造深度报告:中国制造赶德超美的秘密 [R]. 2018.