财务管理

0

人工智能概论研究报告

头像
张迅

人工智能之知识图谱系列研究报告

摘 要

进入21世纪以来,我国在人工智能领域发展越来越迅速,关于数据的采集及搜索这方面也更加广泛,资料信息等通过云端储存,使得查阅资料更加便捷,在《知识图谱与搜索引擎》一书中有详细搜索技巧,像百度百科,360浏览器,搜狗端等,随着社会的发展,人们对于知识的查阅以及了解信息的需求量也越来越大,从而产生了知识图谱这一说法。

为了了解知识图谱是怎样在如今科技发达的社会而普及人类,我为此在知识图谱这一系列问题上展开研究,通过对现实生活的考察,以及知识图谱对人类的作用还有知识图谱未来的发展趋势而深入探索研究。书中对于知识图谱是这样定义的:绘制知识图谱是用三元的方式成为一组,这一组代表基于对知识的理解和对事件所产生的影响的认识,在图书界中,它是知识领域的认知可视化或地图。大量复杂的图表,揭示了知识发展过程与知识发展结构之间的关系。众所周知,有一个由各种信息数据组成的知性网络作为基础,这也许会针对地图上未来的发展和进程。

关键词:数据的采集;知识图谱结构;搜索数据库引擎;知识应用;未来发展趋势

一、简介知识图谱:

(一)组成结构:

在《知识图谱的构建及其应用》中说到,知识图谱是由节点、边组成,每个节点代表一个现实世界中存在的“实体”,每个侧边就是实体与实体之间的“关系”,譬如以“姚明”为一个实体,那么他的女儿、父亲、妻子、队友等等也是一个个实体,而这些实体中又存在各种关系,这样以来知识图谱就成为数据关系网络中最有效的方式,所以说,知识图谱是一种以图示为表示的结构语义,其本质上就是语义信息的网络数据。

(二)作用:

不同种类的知识图谱有着不同的作用角色,他们以不同的方式来获取不同的知识,按知识图谱应用的深度及应用范围其可分为两类:

(1)通用知识图谱:

通用知识图谱简单地说就是解决各类知识盲区,生活常识,科普知识等,将各种知识通过计量搜索而达到可视化,譬如在生活中,我不知道秦朝是如何灭亡的,这时我可以通过百度百科、360搜索等问答系统中的知识图谱来查找历史上关于秦朝的知识,这时我们会发现,数据中会以“秦朝”为实体向周围发散出新的实体分枝以及可以看到两个实体之间的关系。数据中会出现秦朝地起源,发展历程,历代统治者,以及当时所发生的重大事件,乃至后来的衰落,直到灭亡,也可以看到许多史学家分析灭亡的原因,内因和外因,甚至连当时朝代所处的背景和环境也都显而易见。通用知识图谱在大众使用范围中更加广泛,日常中更加常见。是一种已普及的知识图谱。

(2)行业知识图谱:

行业发展知识图谱是一种面向某个领域的图谱,用户必须充分考虑客户的所有各级的要求管理目标,对应的该行业企业技术人员所需的业务场景不同而异,并通过知识的深度和完整性,跌破精度要求非常高,其辅助制图应用复杂的分析方法或辅助决策,从而成为一个严格和丰富的实体。图形计算模型行业专业知识图谱中的实体通常属性比较多且具有重要行业市场价值理论意义,比如在医疗资源方面就有一个很大益处,我舅舅最近身体不舒服,于是去医院检查,医生的诊断决策分为三部分,第一部分为诊前,根据舅舅所描述的不适症状,呕吐、腹泻、食欲不振和低烧,此时医生会根据症状而做出第一步判断,可能是肠胃出了问题,于是第二部分确诊诊断,建议他去采血、B超、肠镜作为诊断辅助,按照节点权重及相关性进行顺序排序,同时进一步做推荐检查;最后根据检查结果报告,确诊为肠炎,从而进行最后一步治疗辅助,开了很多用于肠炎的药,这样三步完成诊断加治疗,一张完好的行业知识图谱就绘制成功了。

二、知识图谱的应用:

(一)不一致性验证:

知识图谱在多方面都有必然的运用,其中我认为在反欺诈这一部分的应用最佳,基于大数据反欺诈的困难在于,如何连接到各种资源,并建设为统一引擎,有效识别欺诈中所描述的内容,并将借款人信息数据建立成为知识图谱,从而有效的发展成了结构化的理解,就像《江湖纵谈》中所说的那样。举个我生活中的实例来说,前几天,邻居家阿姨的儿子因为创业而欠债,公司倒闭,合伙人也跑路了,而借款的合同上写的是他们公司的电话号码,但是合伙人却填写的另一个公司名称,此时这就成为了一个风险点,当债主找上门时,他说他和合伙人是朋友关系,和邻居阿姨是母子关系,而债主和合伙人也是朋友关系,于是我将这些人物的信息添加在“一致性验证”引擎中,从而触发相关知识图谱,我试着推理了一下,阿姨儿子和合伙人是朋友关系,而合伙人和债主是朋友关系,这时有两个可能,债主和阿姨儿子是朋友关系或不是朋友关系,所以这个关系网中存在着显著的不一致性。

(二)失联客户管理:

知识图谱也可以在贷后发挥其强大的作用。 例如,在贷后客户管理的情况下,知识图谱可以帮助我们挖掘出更多潜在的新联系人,从而提高贷后收款成功率。在现实生活中,这样的例子比比皆是,去年我们家借给了亲戚家三万元人民币,而亲戚家因为欠了高利贷而无法偿还我们家这份债,随后玩起了“失踪”,我们无法找到他在哪,联系不到本人,即便试图去联系借款人曾经提供的其他联系人,也无法找到他本人,这就是所谓的“失联”状态,于是万般无奈下我们家只好提起诉讼,法院那方马上开展调查,将借款人周围的潜在联系人挖掘出来,而这部分潜在联系人并没有出现在我们的知识图谱中,法院通过练习借款人的父母,问到了借款人曾经的朋友,生活中经常在一起的朋友,甚至朋友的朋友,最终找到了借款人的位置信息。所以说,知识图谱也可以帮我们找到那些“失联”的客户。

三、知识图谱未来发展趋势:

在当今社会,知识图谱已经涵盖了生活的大部分领域,但仍有一些领域没有涵盖。例如,在工业中,虽然局部公司正在努力朝这个方向发展,但很多方法仍处于研究阶段。主要原因是很多企业对知识图谱没有很好的理解或深入的理解。

但在未来几年中,知识图谱必然会成为一种新型的工业工具,这在目前的趋势中是很容易预测的。当然,知识图谱仍然是一个相对较新的工具,所以在理论的应用上还是会有或多或少的挑战。例如语义数据的准确性,知识图谱只能搜索到关于关键词的数据,却无法筛选出这些数据的准确性和真假性,也无法挑选出对搜索人最有价值的信息,其知识库中总会出现一些冗余,这就涉及到消除歧义这一功能。再比如前文中所提到的知识推理能力,我们可以退出债主与合伙人的关系,却忽略了合伙人是否与债主还有很多共同的朋友,当信息量特别大而多的时候,怎样把这些杂余信息结合到一起,这就是一种概率分析问题。也是知识图谱未来发展的一大方向。

我们目前还不知道知识图谱是否会成为企业实现强大化的人工智能的一种方式。然而,无论我们能否在未来创造一个更好的智能模型来描述人类的思维过程,人工智能方面仍然会把知识图谱当做一个重要组成部分。因为能力和思想同样重要,但它们也需要基石,即知识和记忆。



本文转自 简书,原文链接:https://zhuanlan.zhihu.com/p/147653885,如需转载请自行联系原作者
头像
丢弃