随着信息技术的发展,传统制造业开始发生根本性改变,装备制造领域向数字化、智能化的方向发展.当前存在生产装备系统异构、生产线相对封闭、生产过程数据碎片化等问题,导致信息孤岛,使信息交互变得困难,同时也形成了上层应用系统与数控装备交互的瓶颈,所以工控系统逐渐走向开放和互通,生产商越来越青睐于使用通用的标准和通用的软硬件.目前国际上用于数控装备互联互通的标准主要有MT-Connect和OPC UA两个标准.MT-Connect[1-2]协议使用XML语言描述设备模型,该语言虽然具有简单灵活且格式统一的特点,但是格式较为复杂,对传输网络带宽要求较高,并不适合大数据信息的表达,无法满足复杂组件数控装备设备模型定义的高效性需求;OPC UA协议[3-4]没有统一的设备模型定义,且模型定义没有针对具体对象进行标准化规范,当用户使用其服务时,必须深入研究OPC的运行机制,严格依照复杂的数据定义手册,才能实现数控装备数据的获取.因此,MT-Connect和OPC UA设备模型都无法满足高频数据采集的要求.数控装备工业互联通信协议NC-Link便应运而生,其在实现互联互通的基础上,使用JSON数据格式描述数控装备信息模型,解决了高频数据采集的问题.但是目前NC-Link主要用于描述数控机床,对其他数控装备的描述并没有统一、标准的规范,难免形成碎片化、结构不完善、多源异构的数据,因此设计一套基于NC-Link的数控装备信息模型,可在一定程度上推动我国智能制造领域的发展.因为知识图谱具有结构化表示形式、丰富的语义信息并且善于描述复杂的关系,能够解决数控装备类型繁多、数据结构各异、依赖关系复杂等问题,所以本研究采用基于知识图谱的建模方法,通过非形式化、形式化、本体化三个角度建立领域元模型、领域模型、本体模型,逐步降低信息模型的复杂度,完善模型结构,提升数据采集效率,实现信息模型的构建[5-7].最后根据NC-Link协议规范对信息模型进行实例化,并为信息模型的传输、数据的采集设计开发了安全框架,通过模型的标准化开发和实验测试,为后续研究提供参考.1 信息模型维度与建模整体方案1.1 信息模型维度为了使信息模型能够适配不同结构的数控装备,必须分析各类数控装备数据的内在联系,提取数据中的共性并进行有机组织,使数据以树状结构的形式表达,并最终生成信息模型.为此本研究从三个维度对信息模型进行剖析,形成了三维信息空间,有利于提高建模的准确性,信息模型维度如图1所示.10.13245/j.hust.220604.F001图1信息模型维度信息模型分为三个维度.一是版本维度,描述模型版本的变迁,在一段时间内模型会形成一个稳定版本,若需求或协议升级,则会造成版本的升级,从而形成了版本维度.二是粒度维度,从属性获取、概念组装、关系构建三个层级描述数控装备信息.属性层级为装备初始属性、数值的获取(如“运行状态”“running”“X轴位置”“300.0”),该层级为基础层级;概念层级为多个属性的组装,寻找属性之间的共性从而抽象形成概念(如“数控机床”“X轴”);关系层级由多个概念构建,描述了概念之间的线性、树形、网状关系等(如“数控机床”“包含”“X轴”).三个粒度缺一不可,每个粒度上描述的信息越丰富,则装备模型的结构就越完善.三是更新频率维度,描述了模型在数据采集中的实时性要求,有效性检查和合法性检查保证该信息模型符合模型规范要求,定时采样和异步采样保证信息模型能够实时反馈数控装备数据.1.2 基于NC-Link协议的建模整体方案基于NC-Link的信息模型建模与通信整体方案如图2所示.10.13245/j.hust.220604.F002图2信息模型建模与通信整体方案首先,从信息模型三个维度分析数控装备的数据结构,定义信息模型建模规则,形成数控装备信息模型;然后使用UML类图建模将信息模型抽象至软件系统中,并用自主开发的生成器,将抽象化的信息模型类图转换为与NC-Link协议相对应的JSON文件,该JSON文件即信息模型文件.其次,开发NC-Link服务器,将信息模型文件上传至服务器.NC-Link客户端启动时须要向NC-Link服务器请求最新信息模型文件,并下载保存在客户端本地,然后连接数控装备,根据信息模型文件读取装备数据,并按照信息模型文件中定义的采样需求将数据上传至NC-Link服务器,NC-Link服务器将采集的数据保存至数据中心,以供ERP/MES系统使用和智能化处理.2 基于NC-Link的数控装备信息模型建模2.1 建模分析在此使用数学公式对建模过程进行分析,并解释为何在建模过程中使用知识图谱技术.以O代表对象,S代表状态,I(O,S)代表O在S下期望产生的信息,M(O,S)代表O在S下抽象出的模型.因此,根据M(O,S),可以在需要时推出I(O,S),即M(O,S)→I(O,S).但是在实际应用中,由于缺乏相对应的知识,无法直接构建出M和I,因此本研究采用以下的建模方式.首先,通过装备制造领域知识的学习和实验加工场景下的实验数据,获得Ix(O,S) (下标x表示实验场景下).然后通过逆向工程,根据Ix(O,S)逆向出Mx(O,S),即Ix(O,S)→reverseMx(O,S).Mx(O,S)在实际场景下可以正向推出Ir(O,S) (下标r表示实际场景下),即Mx(O,S)→Ir(O,S).最后,通过比较Ir(O,S)和Ix(O,S)的差异来确认Mx(O,S)是否可用,若两者彼此差异很小,则通过最终的映射和抽象就得到了模型M和信息I.上述过程中关键点在于逆向工程的构建,即须要数字化表示数控装备在整个生命周期中运作的元素和动态,本质上该过程就是工业互联网[8]下的数字孪生,信息模型就是来源于数字孪生的产物.而工业互联网下物理对象繁多、数据结构不同、依赖关系复杂、实时性要求高等问题,导致难以使用传统方式实现孪生需求.由于知识图谱非常适合从非结构化资源中提取数据,善于描述各种实体或者概念之间的关系,并且能够高效解决上下文环境感知后的自动推理,因此本研究认为在工业互联网场景下的数字孪生,最适合的技术是知识图谱[9-10].用K表示知识图谱,K由焦点问题Q、实体集E、概念C、属性值P、属性A和关系R组成,则K=(Q,E,C,P,A,R).因为C,P和E,A属于包含与被包含关系,所以简化后可得K=(Q,E,A,R).因此,逆向工程的初始产物为一系列知识图谱K1,K2,…,即(Ix(O,S)→reverseMx(O,S))=(K1,K2,…).最后通过对K的映射和抽象得到信息模型M,逆向工程即信息模型建模过程如图3所示.10.13245/j.hust.220604.F003图3信息模型建模过程2.2 建模过程首先基于NC-Link协议,确定建模范围;其次通过对各类数控系统的数控装备需求分析,得到若干用例表,再对用例表进行信息抽取、知识融合和知识加工构建知识图谱;最后设计知识图谱到NC-Link信息模型的映射规则,进而映射和抽象生成NC-Link信息模型,解决装备数据互联互通的问题,并将其开发成规范化信息接口,建模步骤如下.2.2.1 建模范围确定根据装备制造领域知识和信息模型的三个维度,分析数控装备数字化结构,确定建模覆盖范围,其中属性集和组件集的结合阐述了模型的粒度维度,同时装备的属性集中包含了版本信息以阐述版本维度,采样通道集和方法集阐述了更新频率维度,如图4所示.10.13245/j.hust.220604.F004图4建模覆盖范围2.2.2 建模数据源获取针对数控装备的信息化标识,选择需求分析的产物用例图/表作为信息或知识的来源.鉴于用例图不能清楚地表达需求,所以本研究使用用例表作为数据源,表1为用例表描述数控机床采样.10.13245/j.hust.220604.T001表1数控机床采样用例表用例名称:数控机床采样用例编号:001活动者:数控系统描述:数控系统上传机床基本信息与运行时数据信息输出:机床ID、机床状态、机床工况、刀具状态、X轴名称、X轴位置、刀具参数…基本事件流:数控系统每隔10 ms上传机床ID、刀具参数、轴位置等数据异常事件流:上传出错,提示报警信息注释:无2.2.3 信息抽取使用人工构造的语义规则、模板、字典分别对用例表中半结构化和非结构化数据进行实体抽取、属性抽取、关系抽取,根据具体的事物抽取实体E={针织机床,切削机床,刀具,轴承,生产商,…},根据事物的属性信息抽取对象属性和数据属性A={运行状态,running,加工件数,刀具速度,…},根据实体间的关系抽取关系R={生产,包含,被包含,…},E,A和R组成了装备制造领域元模型[11].2.2.4 知识融合通过信息提取得到的元模型中存在大量冗余信息、错误信息和歧义概念(如“轴”和“轴承”分别对应两个不同实体、“数控机床”和“机床”对应同一实体),且数据之间的关系缺少逻辑性,通过知识融合可以剔除冗余、错误、歧义信息,增加关系的逻辑性,保证元模型的质量.a. 实体链接首先针对相同名称、相似名称的实体,将其抽取出来组成实体指称项集合N={数控机床,机床,轴,…},然后通过实体链接的方法对实体指称项进行消歧.选择一个指称项ni∈N,最终目标是在实体集E中,选择与指称项具有最高一致性打分的实体ei∈E作为其目标实体,其中Score(e,ni)为一致性打分,当e取值范围为E时,最大值的参数(argmax)的结果是一致性打分取得最大值的实体ei,ei=argmaxe∈E Score(e,ni).在进行一致性打分的过程中,首先通过word2vec模型将实体、实体指称项转换为128维向量,组成实体的向量空间V,然后通过Cosine相似度函数f计算每两个实体的向量之间的相似度tij, tij={f(vi,vj)|vi,vj∈V},最终选出目标实体.b. 知识合并将消除多余信息的E,A和R组成三元组集合,形成详细的数据字典.三元组的基本形式包括(实体,关系,实体)和(实体,属性,属性值)两种,如(轴,包含,X轴)和(刀具,速度,1 500),最终形成装备制造领域模型.2.2.5 知识加工经过信息提取和知识融合形成的领域模型,可得到一系列基本事件的三元组,即构建知识图谱的基本单位.但是三元组缺乏结构化、网状化的表达,因此须要经过本体构建、知识推理、质量评估的过程,最终形成图状结构的本体模型,即知识图谱.a. 本体构建由于领域模型认为实体之间没有差别,如“针织机床”“切削机床”“X轴”这三个实体本身没有差别,但在语义上前两者可能更相似,且与“X轴”差别更大,因此须要构建本体.本体是实体的抽象,定义了一组实体的概念及其之间的关系.本体是树状结构,相邻层次的节点之间具有严格的“IsA”关系,这种单纯的关系有助于知识推理.通过本体可以确定实体之间的语义差别,实现将实体归类成概念集合或概念框架.首先,基于2.2.4节中的Cosine相似度函数计算实体间相似度tij,设定相似度阈值ε,tij越接近于ε,表明两个实体越有可能属于同一语义类别.然后,基于Hearst模式抽取“IsA”实体对,即抽取实体上下位关系,确定实体间的隶属关系,如“针织机床”和“切削机床”属于“数控机床”本体,“X轴”属于“轴”本体,抽取完成即实现了本体的构建.b. 知识推理本体构建后,本体模型就有了基础的雏形,但本体的概念层次关系、实体间的关系、实体的属性大多都是残缺的,因此须要从已有的关系出发进行推理,建立完整的本体模型.使用Path Ranking算法,把本体或实体当作节点,关系或属性当作边,以任意节点为源,在任意边上随意游走,若能走到目的节点,则推断出两个节点间可能存在关系.c. 质量评估经过不断发现新关系,人工进行评估,舍弃置信度较低的知识,完善本体、实体、关系、属性、属性值,最终形成本体模型即知识图谱,如图5所示,图中:橙色圆圈为本体;青色为实体;淡紫色为属性值;线段上黑色文字为关系;紫色文字为属性.10.13245/j.hust.220604.F005图5知识图谱2.2.6 知识更新当增加新的实体时,须要对知识图谱进行更新,由于装备制造领域的实体比较特殊,因此只须对知识图谱进行增量更新,即采用人工干预的方式定义规则,完成知识图谱的更新.2.2.7 信息模型构建a. 节点映射通过以上步骤完成知识图谱的构建,但是由于网状图中信息节点之间的路径具有不确定性,在空间信息量方面存在冗余,无法实现信息模型从根节点到叶节点的唯一性;因此,将网状图转换为与信息模型具有相似结构的树状图势在必行.本研究使用OWL语言建立网状图到树状图的映射,降低数控装备信息模型的空间复杂度,增强信息交互能力.b. 信息模型生成根据树状图对各类装备共性结构进行抽象分析,最终生成信息模型如图6所示,其中:静态属性集为装备或组件的固定信息;动态属性集为装备运行过程中的状态信息;设备组件集为装备的各类组件,各子组件可以递归包含其他子组件;方法集为装备的通用方法.10.13245/j.hust.220604.F006图6信息模型图3 信息模型实例化根据NC-Link协议规范,使用UML类图建模,将信息模型抽象至软件系统中,如图7所示.10.13245/j.hust.220604.F007图7UML类图同时须要生成能被NC-Link服务器解析的信息模型文件,本研究使用JSON文件描述NC-Link信息模型,相比于XML文件,JSON文件数据格式更加简单,语义解释清晰、支持多种语言规范;并且JSON文件易于解析,开发简单,数据压缩传输,因此占用带宽少,数据传输速率快,可满足工业领域数据毫秒级传输的需求.使用自主研发的代码生成工具完成JSON文件生成.4 信息模型传输与数据采集测试4.1 安全模块搭建为了保证信息模型文件和数据在传输过程中的安全性,本研究使用身份认证和访问控制两种技术加强整个传输体系的安全性[12],如图8所示.10.13245/j.hust.220604.F008图8安全传输体系NC-Link客户端、用户、应用程序均须要遵循MQTT协议,以发布/订阅的方式进行身份认证登录服务器,避免非法用户的入侵.登录成功后访问控制模型会对其权限进行控制,约束用户、应用程序能够访问的设备,并对设备操作权限进行划分,避免合法用户的非法或越权操作.4.1.1 身份认证设计方法身份认证服务使用基于国产密码的SSL双向认证,为装备制造内网各类用户提供身份信息注册、凭证发布、用户资料管理及销毁、登录认证功能.认证服务由CA中心、认证服务器、数字证书用户组成,认证流程如图9所示.10.13245/j.hust.220604.F009图9认证流程图认证服务器:认证服务器由NC-Link服务器担任,集中存放设备和用户的身份信息、权限信息、证书信息,在认证服务器上部署服务器证书、安全组件和认证接口,用于装备与服务器或用户与服务器之间的身份认证.数字证书用户:数字证书用户须从CA认证中心下载CA数字证书和个人数字证书,通过与认证服务器双向认证后建立连接,实现装备上传数据,用户能够方便地访问自己权限范围内的装备.用户数字证书的身份信息要与认证系统中注册的用户信息保持一致,才可实现可靠的身份认证.4.1.2 访问控制设计方法为确保数控装备访问的可控性,防止非授权用户访问或越权访问,须要在用户身份真实可信的前提下,提供可信的授权管理服务.以RBAC模型和MQTT中间件实现对用户的有效管理和访问控制,保护数控装备不被非法或越权访问,防止信息泄露.RBAC模型用于给用户分发不同的角色,并将角色与系统权限相关联,本系统设置一个总管理员、若干组管理员及普通用户.总管理员可以创建分组并为分组设置组管理员,同时能够给每组分配可以管理的设备.组管理员可以创建组成员,为组成员设置能够操作的设备,并为每个设备设置安全等级,以约束组成员的读/写权限.MQTT中间件用于和RBAC模型进行联动,当用户登录时,先检查用户名与密码是否正确,若正确则从RBAC模型中获取用户相关权限.当进行订阅/发布操作时,中间件将该操作与权限进行匹配,若一致则证明权限符合,准许操作,若不一致则证明用户正在执行越权操作,中间件拒绝该操作.4.2 实验结果4.2.1 实验环境设备环境:华中数控8型数控系统,FANUC数控系统FS0i-D,SINUMERIK 840D堆垛机器人.NC-Link服务器环境:Ubuntu18.04, Mosquitto-2.0.10,GmSSL,Python Flask.NC-Link客户端环境:Windows或Linux环境,安装C语言、Mosquitto-2.0.10及GmSSL等库文件.数据中心环境:InfluxDB,Redis数据库.4.2.2 实验测试首先,在NC-Link客户端安装C语言编写的适配器软件,其用于加载、解析信息模型文件并连接NC-Link服务器与数控装备,实现按照信息模型文件中规定的数据项对数控装备进行采样,并以统一格式发送到NC-Link服务器,或接收从服务器传来的控制信息,传递到相应的数控装备.其次,在NC-Link服务器搭建MQTT模块作为消息中间件,用于信息传输;搭建GmSSL模块用于加密传输信息;搭建Python语言编写的服务模块,用于处理消息中间件中的数据,将其保存到数据中心,并按照用户需求向客户端发送控制信息.开启客户端、服务器,客户端登录时须要经过unpwd_check检查用户名与密码,Authenticated值为1说明登录成功;其次客户端进行订阅/发布操作需要经过aclcheck验证权限问题,Authorized值为1说明权限符合,值为0说明该操作为越权操作,服务器予以拒绝,如图10所示.10.13245/j.hust.220604.F010图10安全策略采集数控系统中的数据信息,检验信息模型适配能力,以轴位置信息为例,使用InfluxDB数据库存储,使用Grafana自动化展示数据,如图11所示,结果证明本研究构建的信息模型能够与不同的数控系统进行适配.10.13245/j.hust.220604.F011图11装备信息实验中将信息模型中采集频率设置为10 ms,通过对比加入安全机制前后的耗时,对数据的传输效率进行测试,如图12所示,结果证明采样数据能够按照模型文件的规定达到毫秒级采样,并且安全机制对传输效率的影响较小,数据传输安全性得到大幅度提高,本研究认为可以采用该安全策略.10.13245/j.hust.220604.F012图12加入安全机制后采样性能对比5 结语本研究提出一种基于知识图谱的信息模型建模方法,能够解决数据碎片化和多源异构数据导致数据的采集效率低、结构不完善、格式不统一的问题,并且该信息模型扩大了NC-Link协议的适用范围.实验结果证明:该信息模型能够适配不同的数控装备,实现毫秒级的数据采集,而且加入了安全模块后,对模型通信效率的影响较小,大幅提高了数据采集的安全性,实用性和可行性强.
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览