大数据时代的到来,正在逐渐改变人类的思维方式。
以当下深度学习模型为例,我们不再纠结、也无力再关注输入数据与执行结果背后的因果逻辑,而只是通过训练AI模型实现诸如文本分析、智能语音等各类能力。这类能力也正在改变着当下物联网领域的各个方面。
相关关系正在因大数据时代的到来而逐渐取代传统的因果关系,这一关系是否同样适用于工业互联网呢?
如果一定要说用海量数据找相关关系,理论上是OK的。但实际上在工业领域目前还不现实。工业领域的大数据其实不是真正意义上的大数据,数据量并没有那么大,我们更强调的是数据的质量如何、工况全不全、采样频率够不够,这与传统互联网需要的数据也有所不同。
天泽智云CEO孙昕向雷锋网这样解释工业中的大数据。
孙昕曾任IBM RATIONAL大中华区技术总经理、软通动力研发副总裁,后合伙创办灵动科技和祺鲲科技两家公司,天泽智云正是孙昕目前任职CEO的一家面向工业互联网应用的企业,企业核心技术团队来自美国智能维护系统(IMS)中心。
据相关统计数据显示,国内工业互联网相关企业已经有数千家之多,其中,工业互联网平台型企业超过300家,预计今年国内整个产业规模将达到4800亿元。
然而,目前国内工业互联网发展仍处于初期阶段,从概念到技术体系构建仍有诸多问题有待进一步被清晰、被解决。
工业大数据如何处理?工业互联网/工业AI企业现阶段发展如何?工业互联网从概念到落地,有哪些关键性问题尚待解决?企业从数字化到智能化又有怎样的路要走?
雷锋网带着这些问题专程拜访了天泽智云,并与天泽智云CEO孙昕、天泽智云高级副总裁谢炯、天泽智云技术研发副总裁金超博士就相关问题进行了探讨。
从天泽智云的创业与发展,从他们多年工业互联网从业经验中,我们也可就当下国内工业互联网企业发展、技术体系、生态构建略窥一二。
天泽智云的第一单
2016年成立的天泽智云至今已经走到了第三个年头,国内像天泽智云这样工业互联网领域的初创企业不在少数,其中出生即含着金钥匙的企业也为数不少,天泽智云的这把金钥匙就是IMS中心。IMS中心,全称美国智能维护系统中心,也被美国工业界誉为工业大数据人才的西点军校。天泽智云由IMS中心创始主任李杰教授担任首席顾问,核心技术团队均由IMS中心机械工程博士组成。
“正是这样的光环及技术积累,使得我们在创立之初受到很多大型国企的青睐,”孙昕告诉雷锋网,“但真正意义上的第一单应该是中电华强。”
中电华强作为国内最大的焊接生产线制造商,在2016年也面临着企业转型。当时他们开始思考中电华强是否可以像GE一样转型,从单纯卖设备到将来卖服务,从生产制造型企业到将来生产能力输出的服务型企业。
在这过程中,真正阻碍企业转型的是需要拥有一些能够支撑变革的新技术。卖服务的前提是要知道卖出去的产线什么时候坏,怎么维修,以及何时需要备品、备件。因而,当时的中电华强需要一个智能工厂的核心设备健康预测评估平台。
“中电华强是我们2016年11月公司成立之初即开始接触的一家企业,从最开始不了解客户需求,到顺利签下订单,我们仅仅用了三个月。当时我们和中电华强的合作主要分两期完成,主要为中电华强做能够实现故障预测的平台,其中一期是针对一条典型产线的工作,”孙昕回忆称。
为什么不是先做数字化、做在线监测?
对此,孙昕表示,“设备监控、在线监测是行业内一直在做的一件事,它并不是一项新的技术,但是要从监控再往前走,做预测性维护,要知道它未来会发生什么,这使得所有生产、维护、备品、备件策略都会随之发生根本性变化。”
企业智能化转型的思考:数据价值通过场景痛点入手
尽管传统企业当下正面临转型升级,但在这一过程中,整个行业仍面临诸多问题。尤其在当下工业互联网 发展初期,智能化技术尚且不够成熟;工业企业相对互联网企业较为保守,对新技术的尝试不够大胆,因而造成双重困局。天泽智云将工业智能落地过程中遇到最多的问题总结为以下两点:
第一个,企业客户“不买账”。
整个工业体系已经发展百年之久,行业在成熟、专业的同时也意味着领域知识固化。身在体系中的人可能仅仅知道体系中一套能够尽量缓解问题、行之有效的方法。工业互联网或工业AI的技术、产品对于传统工业企业来说是新东西,但固化的观念难以被改变,当下的AI算法又由于数据质量差、标签少等多种原因,无法快速解决行业里多年的痛点,就直接造成了企业和客户不买账。
第二,目前,工业领域的大数据环境其实并不是大数据,仍是大量的“小数据”。从而导致前期数据驱动的模型很可能是不准确的。
也有业内人士认为,工业领域的大数据更应该称为「BIG SMALL DATA」。主要原因在于当下很多工业中的数据还没有被整合起来。
2007年,谷歌前人工智能首席科学家李飞飞在普林斯顿大学任职期间启动了ImageNet项目,这项工作的直接结果之一是形成了一套有标签的数据集。但是工业诸如风电、化工等领域目前并没有相应的数据集。这主要是因为现有的故障样本太少,没有标签;此前工业系统中采集的数据主要是为了做监控、控制、管理应用,而非用来分析。
在消费领域可能这样的数据能够快速实现诸如消费者选址此类的价值,但是在工业领域,由于各个细分领域专业度高,我们必须要有相应领域能够体现其物理变化的数据量。
金超告诉雷锋网,“如果用户本身观念是防备的,前期模型又不够精准,最后导致的就是相关系统得不到使用。由此可见,传统AI想要单纯从数据实现价值通路其实是走不通的。”
为此,工业互联网企业就需要想其他办法推进产业对工业互联网的应用。金超告诉雷锋网,从痛点(场景)入手是一个不错的选择。
天泽智云此前曾提出十年内实现一百个无忧工业场景的目标。所谓场景,就是具有通用意义、可复制性的不同领域面临的共性问题。如果这样的问题我们能够有较好的解决方案,其实是可以推广的,其价值也可以被最大化。
产品化道路上的思考:百万工业APP如何造?
2017年11月27日,国务院正式印发《关于深化“互联网+先进制造业”发展工业互联网的指导意见》,明确提出:到2020年,要培育30万个以上的工业APP即工业应用程序,推动30万家企业应用工业互联网平台;到2025年,要形成3~5家具有国际竞争力的工业互联网平台,实现百万工业APP培育以及百万企业上云。
百万工业APP成为工业互联网领域的一个既定目标。
那么,问题来了,百万工业APP要如何造?
这也是天泽智云在从公司最初成立为客户做项目到产品化过程中思考的一个问题。
对于创业企业,在初创阶段做好项目是企业得以生存下来的关键,而要想持续成长,产品化也是必由之路。
“作为创业企业,很企业为了生存会选择先做项目,但这样很可能会陷入到一个恶性循环中,实际上我们初创期大概把50%甚至更多的人力投入到了产品体系构建中。”孙昕告诉雷锋网,“项目和产品,一个是业务需求,另一个是体系更好执行项目的基础,二者是一个循环,这两条腿一定要兼顾。”
纵观当下工业互联网企业发展思路,从一定程度上延续了消费物联网关键厂商的打法,从项目制转平台化,做工业互联网平台。
天泽智云略有不同,首先被天泽智云产品化的是一款名为GenPro的智能分析、建模工具。
2017年12月,天泽智云发布初代版本GenPro。“GenPro基于我们在IMS中心积累的案例、算法、方法论,形成具有行业特性的组件和行业模板,因而也可以将GenPro视为拥有建模能力的场景资源池。”
GenPro建模流程画布
构建工业AI,需要怎样的产品化体系?
对此,金超博士解释称:
不同于消费领域创造性产品化,工业AI落地的起点并不是数据,是痛点,而痛点来自于(工业)领域知识,我们会与行业专家的经验结合,找到容易落地的痛点,并根据现有的变量类型和数据质量决定是否需要再补采。
具体到工业产品交付中,交付模型才是交付价值的开始。
之后由于模型不准确的问题仍然存在,我们需要对模型进行全生命周期管理,这就需要对模型进行持续迭代。如果数据要积累,要把其中信息提取出来的话,就必须要有一个体系化的平台作支撑。
基于这样的逻辑,天泽智云在今年3月再次发布了三款新品:CyberSphere、EdgePro、CyberRepository。
前文提到,GenPro本身是一个资源池,也是一个工业智能分析与建模工具,它囊括了融合领域知识的行业算子与行业建模模板,建出来这些模型就需要一个管理工具。
CyberRepository就是这样一个对模型、流程(建模的过程,是算法组件的有机组合,也可以理解为是一种模板)的管理工具。CyberRepository实现了智能资产的全面管理,将散落在各个系统的模型统一管控,同时实现了基于资产的模型协作开发,提升了建模效率。
有建模工具,管理模型的工具,最后模型总要发布到生产环境中。
CyberSphere是一个模型执行引擎以及模型效果在线监控工具,它具备强健的模型适应能力,真正做到了模型发布即使用,加速工业智能交付。同时,它具备模型运行管理、回放功能,模型迭代完后,可以检测模型在原来的数据上是否运行正常,甚至模型自训练、自更新功能,“未来如果整个平台架构做得足够成熟后,我们可以基于统一标准实现模型自动更迭。”
外加边缘智能管理系统EdgePro,构成天泽智云围绕模型构建的一个工业互联网采集、分析、交付、管理体系。“这套体系也从一定程度上契合了工业互联网联盟(IIC)架构任务组联合主席林诗万提出的工业互联网建模难、管模难、用模难的思路。”金超告诉雷锋网(公众号:雷锋网)。
也正是这套体系,解释了天泽智云对于百万工业APP的构建思路。
总结天泽智云产品化工作进程,孙昕总结为两类:
第一,构建行业的应用。行业应用可以带来直接价值,例如风电领域的智能化风厂产品可以为风电行业带来直接价值;
第二,IAI解决方案。要造百万工业APP,就要有能造工业APP的体系和工具,前文提到的产品矩阵也是我们面型工业领域构建的IAI解决方案。
国家在谈百万APP的时候,工业APP真的是一个完全靠人工完成的工作吗?
其实,百万APP不仅要一个一个APP去做,更要找到一套工程化的方法和实践辅助工具。
至少,天泽智云是这样认为的,也是这样做的。
CPS架构的5C模型
在当下工业互联网体系中,有一类技术架构颇受欢迎,即CPS(Cyber-Physical Systems,信息物理系统)。天泽智云也是主要基于CPS架构做工业赋能体系。“CPS其实现在已经快变成哈姆雷特了,由于工业本身是一个复杂的集合,问题都非常个性化,很多人都定义了自己对CPS的理解,这也没有对错之分。”金超告诉雷锋网。
天泽智云对CPS架构的理解基于李杰教授在2014年提出的5C架构,其中,5C架构分别指:连接(Connection)、分析(Conversion)、网络(Cyber)、认知(Congnition)、执行(Configuration)。
就CPS的5C架构,结合李杰教授的《CPS:新一代工业智能》,金超认为有以下几个特点:
第一,数据驱动。我们做工业AI离不开数据,虽然我们在强调整合领域知识等,但是最终目标还是要有足够多的数据,实现决策过程自动化。
第二,全局闭环。CPS是一个泛化的概念。不仅需要工程师写控制算法,更多要让CPS系统觉知当下状态,然后让当下状态能够反映这个模型,然后能够根据我们想要达到的目标去更新模型,从而影响实际工业系统进行迭代。
第三,异构整合。在这里面CPS它可能涉及到不仅仅是一个单体的一个单点,更多的是一个囊括不同部分的异构系统性的架构。
第四,传承迭代。在CPS构建完成后,知识将被固化,有CPS本身不断自我更新、迭代,既有的知识将能够自动扩展,持续传承。
工业智能的落地问题其实大部分都是工程问题,需要不同部门共同协作。从数据采集、预处理、建模、深度学习、模型验证、可视化等,到最终构建的工业智能APP,会涉及到诸如从控制器里面采集数据,自己安装传感器,以及最后的展示。 最终搭建的智能化系统要能够自动迭代、自动获取信息、自动分析和判断,决策之后自动去影响实际工业系统。只有把5C贯穿,才能真正实现智能化。
工业互联网的协议问题
工业环境中,协议标准不统一是当下又一个令人头疼的问题。尽管国际上已有一些标准化程度较高的协议,以异构性较高的机加工行业为例,美国的MTConnect,欧洲的OPCUA,国内的NC-Link已经是标准化程度较高的协议,但目前仍是碎片化严重。天泽智云的边缘设备EdgePro也在今年3月的发布会上初次对外亮相,主要功能是进行数据采集,由此可见,天泽智云也要面对工业协议的问题。
金超告诉雷锋网,标准逐渐统一已经是行业的一个大趋势。面对当下工业领域协议异构性高的问题,天泽智云一方面自己在与众多工业协议做兼容,另一方面也在通过行业合作伙伴合作进行协议兼容。
孙昕认为,我个人觉得数据采集技术上已经不是难点,甚至可以说是已经一片红海,采集数据更多要靠时间积累。拿到数据如何应用才是当下技术关键点。
前文提到工业中的大数据其实目前大多数情况仍是“小数据”,因而,需要针对性找有用的数据,并且有能力针对数据进行分析,从而带来最终价值,即降低成本、减少库存、提高能效等。
预测性维护落地难在哪里?
在工业互联网体系中,预测性维护被认为是当下最有需求、最有“前途”,也是最难落地的工作之一。无论是有百年经验的工业巨头、当下的互联网企业巨头,还是工业互联网中诸多优秀创业企业,大家现在做的预测性维护相关工作主要仍是提前预测故障出现,而并无法预测出故障原因。
天泽智云作为强调工业AI的企业之一,也是如此。
金超认为,预测性维护之所以难落地,原因在于大家对当下技术的预期太高,同时还有以下两方面原因:
第一,场景的选择。
不是所有的场景都适合做预测性维护,IMS中心就预测性维护有一个四象限图,横轴为故障频率,纵轴为出现故障后的影响。只有故障出现频率不高,出现故障影响较大的高价值核心工业设备(例如风力发电机的大部件、航空发动机、汽车柴油机等)才适合做预测性维护。
【 图片来源:inderscience 所有者:Lee,J.,Bagheri,B.,& Kao,H.-A 】
第二,用户的配合程度,IT和OT的融合能力。
工业智能与预测性维护的应用,需要配合管理体系、KPI等优化更新。为工业企业做完工业智能化系统或软件后,管理体系是否跟得上决定系统最终的落地效果。
以天泽智云为某钢铁厂做的工业智能系统为例,在完成系统构建后,还做了以下工作:
首先,让大家了解这个系统是如何运作的,大大小小进行了三十多次培训,每个部门我们不断的去宣讲这个系统的价值和意义。
然后,我们盯一个班组,培养标杆、模范班组。我们盯着这个班组在工作过程中应用这套系统,然后与其他未使用系统的班组做对比。
最后,通过实际结果数据让企业领导意识到这套系统的价值,并推进管理体系、KPI制度的改革,并明确这个系统的边界在哪里。
智能化不能解决所有的问题,总要有一些应急预案与之形成一套组合拳。这样打出来之后,才开始真正实现价值。
工业互联网体系需要怎样的人才?
天泽智云初创已有将近三年,站在巨人(IMS中心)肩膀上的天泽智云在工业互联网或工业智能方面对外拥有怎样的业务能力?谢炯将天泽智云的业务能力归结为三个方面:
第一,赋能组织。我们认为这里的组织一方面包括一些工业数字化、信息化程度较高,并且有比较强的技术研发实力、需要构建工业智能体系的大型企业;另一方面,包括对于行业场景和技术希望有一套技术体系能够帮助他更好地去沉淀能力,最后产出工业APP供最终用户使用的厂商或机构。
第二,赋能平台。平台包含不同的技术流派和合作伙伴,包括对于硬件平台的赋能(比如低功耗、高性能、安全可靠,覆盖工业场景端到端的边缘计算体系构建),同时也可与工业互联网平台(注重设备接入、管理、数据存储、可视化)灵活集成,为其补充全栈IAI能力等。
第三,人才培养。理解教授认为中国较美国在工业大数据和工业智能方面的人才缺口其实非常大,因而发现人才、培养人才很重要。我们通过天泽智云从IMS传承的知识体系,结合现有的IAI产品,针对诸如企业、高校、研究院所等不同群体,提供不同维度的培训和实践,为工业智能人才赋能。。
其中,孙昕特别强调了人才培养问题,当下工业互联网需要怎样的技术型人才?
工业互联网在具体领域应用中需要很强的行业知识,行业专家是当下工业互联网企业争抢的人才。但既懂行业,又懂信息化,还要有前沿科技视角的人才少之又少,所以我们更需要有快速学习能力,有多行业知识快速融合能力的人才体系。
IMS中心在过去将近20年的时间做了150个工业项目,服务了90个全球性制造型企业。在意大利,史喆、文静博士做轨交项目时候,是他们人生中第一次接触这个行业;金超博士做半导体的时候,也是IMS中心第一次接触半导体行业。
此外,孙昕也表示,“我们也非常认同多与行业专家交流,甚至将这些专家作为我们的行业合作伙伴、我们的最终用户,我们也可以向这些专家学习他们的业务知识,快速做一些跨行业的工作。”
工业互联网发展进程:从0到1,从1到100
前文提到,我国目前工业互联网相关企业有千家之多,平台型企业也有数百家,之所以会出现这样的现状,除了政策利好,行业初期爆发性增长外,工业互联网各领域专业性强,碎片化严重也是原因之一。也正是由于工业领域的碎片化严重,使得多领域,甚至全领域通用平台的构建,至少就目前来看不太现实,行业垂直类通用解决方案或平台成为目前的集大成者和关键。
各厂商对此也在制定着自己的计划表,天泽智云也有自己的计划表,谢炯告诉雷锋网,这一计划表分为短期、中期、长期计划,简单可以可以总结为「2+2+0.5」:
短期,将基于风电、机加工行业中的成功案例打磨出的行业产品进行渗透到市场,一方面获得市场占有率及更大的用户群体,同时也继续反过来将我们的行业产品打磨得更加成熟;
中期,通过在执行的客户项目去探索新的重点行业和领域,从中挖掘出有效场景,从而在下一个迭代周期中能够演化成另外两个新的行业产品;
长期,保持投入一定的资源和精力持续关注一些我们认为具备潜力的新兴产业,早为之所,常备不懈。
2019年,只是工业互联网抢滩登陆战的开始,从0到1,再从1到100,这个过程之间是否还需要再切分为几个阶段,真正行业初貌或许要在五年之后才能看清。