当前位置:主页 > 工作探索 > 工作创新举措 >

知识图谱产业应用及标准化需求研究

时间:2021-08-09 | 栏目:工作创新举措 | 点击:

1 引言
 
知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部分。知识图谱是以结构化的形式描述客观世界中的概念、实体及其关系的大型知识网络,将信息表达成更接近人类认知的形式,提供了一种更好地组织、管理和理解海量信息的能力。在政策部署、技术研发、标准研制、产业化推广、前沿应用场景试点等多方面因素的共同驱动下,知识图谱在智慧金融、智慧医疗、智慧能源、智能制造等领域取得一系列落地应用成效,并逐渐与各领域需求深度融合。同时,在各行业的数字化转型过程中,跨领域、行业或产业的知识图谱也逐渐获得关注。
 
为加速推动知识图谱在各行业的深度应用,我国在人工智能相关政策中进行了部署,包括《新一代人工智能发展规划》《促进新一代人工智能产业发展三年行动计划(2018—2020)》《高等学校人工智能创新行动计划》等。此外,德国2018年11月发布的《人工智能战略》及美国2019年6月发布的《美国人工智能研发战略计划2019更新版》以及其他国家人工智能国家战略,也对知识发现、基于知识的系统等方面进行了相关部署。围绕知识图谱中关键技术的最新研究进展,文献对其进行了综述,但尚未覆盖工程角度知识图谱产业化应用中需关注的知识图谱生命周期、标准化等内容。
 
2 知识图谱应用成效
 
2020年3~9月,中国电子技术标准化研究院会同50余家单位就知识图谱在疫情防控及智慧金融、智慧医疗、智能制造等细分领域的应用案例进行了收集整理,共收集58项案例,覆盖了14个领域。通过梳理发现,知识图谱在各领域应用实践中已逐渐取得成效,并对推动相关行业及企业探索和实现“知识驱动”下的转型升级具有重要意义。所收集案例在各领域的典型成效如表1所示。
 
表 1 知识图谱在各领域应用成效总结
 
 
3 知识图谱技术实施路径
 
3.1 知识图谱构建流程
 
知识图谱的构建既有赖于知识表示、知识建模、知识获取、知识融合、知识存储、知识计算等核心环节的协同,同时有赖于质评估等支撑环节的保障。文献对金融、医疗、电力、教育等领域知识图谱构建技术进行了分析,结合收集的典型案例中知识图谱构建路径,知识图谱构建流程可总结为图1描述的结构。其中,知识图谱构建所需的前端输入包括应用需求、数据、专家知识、行业知识、质量指标、支撑技术与服务以及安全、监管、测评要求等,知识图谱构建所形成的知识图谱产品或服务将用于语义搜索、演化分析、知识问答、对话理解等通用知识图谱应用及智慧金融、智慧医疗、智能制造等特定行业知识图谱应用。
 
图 1 知识图谱构建流程结构图
 
针对前端输入,应用需求主要用于明确所形成知识图谱产品或服务的整体架构、应用方向、应用场景和验收考核指标等;数据包括基础训练与测试数据、业务数据等,主要用于支持知识表示学习、知识获取等环节算法模型的设计、训练测试以及后续知识图谱的构建;专家知识、行业知识主要用于支持知识建模、知识融合、知识计算等环节,以及架构、算法和实现途径的设计、开发与验证;质量指标主要用于评估和控制知识图谱构建过程中各环节的质量以满足应用需求;支撑技术与服务主要用于支持各环节实现过程中所需自然语言处理、机器学习、大数据等技术的融合与应用;安全、监管、测评要求等主要用于第三方管理或认证测评机构对知识图谱构建过程及最终输出产品或服务的质量监督等。
 
3.2 知识图谱生命周期
 
基于知识图谱的应用系统质量不仅与知识图谱构建过程相关,还与该系统开发与部署过程中的质量直接相关。根据已收集案例中知识图谱系统全生命周期质量管控的需求,知识图谱生命周期需同时反映构建过程及知识图谱相关系统开发与部署过程的特点。从技术构成和工程实施两个视角出发,知识图谱生命周期可细分为知识生命周期和知识图谱系统生命周期两个维度,知识图谱的实际落地与应用需同时关注上述两个维度的内容。其中,知识生命周期由知识表示、知识建模、知识获取、知识融合、知识存储、知识计算、知识应用和维护等阶段。知识图谱系统生命周期由需求分析、方案设计、功能开发和验证、图谱构建与集成部署、运营推广、退役更新等阶段。
 
知识图谱系统生命周期在不同阶段需对知识生命周期多个环节的内容进行关注,如图2所示。
 
图 2 知识图谱系统生命周期流程图
 
●在需求分析阶段,主要对知识计算和知识应用场景及相关性能要求进行分析和梳理,明确拟建设知识图谱系统的输入数据、需衔接的支撑系统、业务系统等,并在必要时对数据治理提出需求;
 
●在方案设计阶段,根据梳理后的需求和应用场景中所涉及知识类型对知识表示方式、知识模型框架、知识获取要求、知识存储结构、知识融合约束等方案进行逐一解构,并形成知识图谱系统的方案;
 
●在功能开发与验证阶段,根据设计形成的方案对知识图谱系统中各模块及其中配置的算法模型进行功能开发和训练,并根据必要的基础数据对各项功能进行验证和修正;
 
●在图谱构建与集成部署阶段,对知识图谱系统各项功能与应用场景相关支撑系统和业务系统进行集成,并根据获取的业务数据、专家知识、行业知识、常识完成知识图谱构建,最终在应用现场进行实际部署和联合调试;
 
●在运营推广阶段,基于已部署完成的知识图谱系统,对系统管理和应用相关人员进行全面培训,并在企业或行业内部进行持续的推广,以持续提升系统性能和服务能力;
 
●在使用维护阶段,根据系统长期使用过程中发现的问题,对知识模型、知识表示方式、知识计算能力、知识应用功能进行调整和完善,以保障系统在较长应用周期内的有效性和适用性;
 
●在退役更新阶段,当系统功能和性能难以满足用户需求时,基于成本、技术复杂度、实施周期等条件对系统构成进行全面评估以判断是否进行系统的全面退役或更新。
 
4 知识图谱标准体系研究
 
4.1 知识图谱标准体系框架
 
知识图谱的标准化对于提升知识图谱构建效率,推动知识在多领域挖掘与共享,发挥知识图谱技术价值,加快知识图谱落地应用,降低知识图谱系统成本有重要意义。随着知识图谱在各领域的深化应用,知识图谱技术框架、性能测试评估、能力成熟度模型、知识交换协议及领域知识图谱构建与应用要求等方面的标准化需求日益攀升。
 
依托知识图谱技术路径中所涉及关键技术、数字基础设施、产品与服务模式、行业应用特征,结合知识图谱相关系统在实践应用过程中所需配置的测试评估、质量管控、互联互通、运维与安全等必要措施,上述方面的标准化需求可梳理分解为知识图谱标准体系结构框架,如图3所示。
 
图 3 知识图谱标准体系结构图
 
4.2 知识图谱标准化研究进展
 
目前,在ISO/IECJTC1/SC42(国际标准化组织/国际电工委员会第一联合技术委员会人工智能分技术委员会)、IEEE知识图谱标准化工作组、知识图谱国家标准编制工作组推动下立项了多项知识图谱领域相关国际标准、国家标准、团体标准,形成了知识工程顶层标准、知识图谱顶层标准、知识图谱共性基础标准、知识图谱细分领域标准及配套白皮书、案例集等协同推进的局面,如图4、图5所示。
 
图 4 知识图谱领域现有标准
 
图 5 知识图谱领域相关标准关系图
 
此外,针对知识图谱构建与应用相关软件产品或服务平台的测评与认证需求,中国电子技术标准化研究院联合北京赛西认证有限责任公司等企事业单位,依托知识图谱相关标准等研制了《知识图谱构建平台认证技术规范》《知识图谱应用平台认证技术规范》《知识图谱构建平台认证实施规则》和《知识图谱应用平台认证实施规则》,提出了测评与认证指标体系。目前,首批通过第三方知识图谱产品认证单位包括联想、华为、百度、腾讯云、蚂蚁金服、清华大学等。
 
5 结语
 
尽管知识图谱技术已初步在各领域落地应用,但由于知识图谱在建成后将逐渐成为企业中重要的知识服务基础设施,而且在构建过程中有赖于大量企业内和行业内专家的介入与支持,因此需企业在战略层面提供必要的保障措施,如长周期战略规划、专家资源投入、技术创新能力拓展等。
 
此外,企业内多源异构数据治理、信息安全制度衔接、风险管控、系统试运行与测试评估、知识共享与交换等方面也需要进行系统规划,最终保障交付系统的易用性和可靠性。上述问题的解决不仅依赖于知识图谱构建中关键技术的突破,也需要知识图谱标准化工作以及知识图谱产业推进方阵筹备等产业生态体系建设方面工作的协同推进,共同塑造可持续、优质的知识图谱产业应用市场。
 
原文刊载于《信息技术与标准化》2021年第5期 作者:中国电子技术标准化研究院 李瑞琪 李佳 韦莎 马原野 焦国涛
 

相关文章