发布时间:2021-07-19 | 阅读:
随着《中国制造2025》的持续推进,工业制造业亟须由传统制造向智能制造转型升级。由于没有有效的信息化手段,无法合理加工分析成价值更高的信息和知识,信息预判和数据追溯困难。同时数据的专业性、数据分析判定往往受限于专业人员的知识结构与工作经验,信息判断效率低、成本高。人工智能和大数据技术在工业制造业领域的应用和研究,是解决这些问题的核心和重要手段。
人工智能的发展经历了从数据的表示、计算到感知三个阶段,第四个发展阶段的的核心是认知。实现人工智能第四发展阶段的跨越,对于领域知识大量提取积累是基础条件,知识图谱便是实现这一基础条件的技术实现方式之一。
那么,什么是知识图谱呢?其实,我们生活中处处都可以看到知识图谱的影子。我们来看看几个熟悉场景——
精准感知任务与场景,想用户之未想,从行为推荐发展到行为与语义融合的智能推荐。
人机交互方式更加自然,花式交互取代关键词搜索成为主流交互方式,你手中的十万个为什么,一切皆可问答:图片问答、新闻问答、百科问答。
能够进行信息的分析和推理,是人工智能领域最关注的研究重点之一。而知识图谱是这一领域最成熟的技术应用之一,通过对海量信息进行分析,最终得到合理的推论,从而实现人工智能解放人类大脑,甚至超越大脑,实现信息价值变现。
你可能有个疑问,那工业中怎么应用呢?我们从小就在看《钢铁是怎么炼成的》,我们不会真以为使用人工智能就可以炼成钢铁吧?其实,人工智能还真的可以。
我们来看看制造业的产业链:从下图中,不难看出我们使用的各种家电用品是经过各类矿产层层加工提炼而成。那么,这跟人工智能有什么关系呢?
其实,在工业生产过程中会产生各种各样的产品缺陷,如钢铁生产过程中会有麻点、裂纹、文本、凹坑等:
那么,如何通过技术的实现保障产品的质量,进一步提升产能呢?这就需要通过人工智能技术手段,实现对钢铁生产的各种过程进行把控及分析。技术的处理流程如下图:
P1:数据准备
在钢铁行业中存在大量的非结构化或半结构化行业标准规范、缺陷文档数据,缺陷知识量化系统主要是利用现有的文档知识针对性地解决实际生产过程中的问题。因此,从半结构或非结构的数据中获取知识的方法是技术关键。
P2:数据转换及知识抽取
通过非结构化或半结构化的缺陷知识文档,识别读取缺陷库及行业标准(即客户所提供的各类文档)内的文本信息,形成语料库。部分文本信息格式及内容不规范(如图片、表格等)需要在入库前进行统一的处理。
缺陷知识量化系统将国际标准、国内标准、行业标准和企业生产过程标准,汇总成标准库,将已掌握的缺陷图片、影像和文字描述形成缺陷库,两库进行表象关联输出工艺改造建议、缺陷形成原因分析等,这也是数据进行清洗过程的一个关键数据参考基准。
文本数据知识抽取关键技术:钢铁生产文本数据主要包含各种缺陷数据及常规的解决方案,其文本数据中包含大量的实体,而对实体的识别是文本处理的关键技术点。
钢铁相关的实体类型多样,数量众多,不断有新的命名实体涌现,如新缺陷名字、新的标准名称。其实体构成结构比较复杂、某些类型的命名实体词的长度没有统一规定并限制。
不同场景下,实体的命名可能存在歧义,如下图中的实体S在整个系统中存在多个与之关联的实体。因此,在缺陷知识量化过程中如何有效准确地识别实体是技术的难点。
缺陷实体的识别,需要对缺陷知识的分析及词性的标注。通过启发式的规则筛选,使用KNN算法能实现对缺陷实体进行筛选和分类。相关的技术框架如下图所示:
实体提取主要的技术思路是将已有的知识对应到丰富的非结构语料中,从而生成大量的训练数据,通过少量的人工标注、现有的知识库、特定的语句结构构成模型的识别规则。实体识别模型关系如下:
自然语言处理NLP主要通过缺陷知识生成知识语法分析树,获取缺陷知识的词法信息和句法信息,通过知识语句的特定结构获取语句语义的信息。如“波浪是一种锻造缺陷”的解析结构如下:
知识的获取如下:
缺陷知识的提取结果如下:
P3:知识处理
缺陷知识量化核心机器学习模型KNN算法:
缺陷知识量KNN算法筛选及分类:
图片数据知识抽取的关键技术:钢铁缺陷的另外一种非结构化类型数据是图片数据。图片数据中包含了各种缺陷的知识。如何对图像识别是图像数据处理的关键技术点。
图像识别分类是利用计算机对图像进行处理、分析和理解的一种技术,其中对于图片识别主要用到深度学习中的神经网络,主要通过输入缺陷图片,然后利用深度学习模型实现对缺陷各种属性和特征的提取。其过程如下图:
缺陷知识图像处理核心技术深度学习算法:
缺陷知识图像处理结果:
P4:知识展现
钢铁缺陷量化系统,主要是通过各类数据结合行业标准进行数据处理,其中核心技术是对非结构化或半结构化的文本数据或图谱数据进行缺陷知识量化过程。结合业务系统的需求,可以通过其缺陷知识量化系统进行各种指标的量化,并形成针对特定生产环境的新的生产过程控制标准。如:结合企业生产环境及历史缺陷产品生产参数进行量化,分析各种参数指标及指标组合的合理范围。如形成麻点、裂纹的温度、湿度等参数范围。