一图读懂知识图谱

1 什么是知识图谱?

通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。

知识图谱这个网络具备以下3种特性:

        1.1 由节点(Point)和边(Edge)组成

        1.2 每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”

        1.3 知识图谱是关系的最有效的表示方式

                

简单总结知识图谱就是语义网络,是一种基于图的数据结构。

知识图谱主要分为两大类:

        1.通用知识图谱,用自己的话来讲就是大家都可以用的一种。不涉及深层的专业知识以及行业知识内容,例如有:一些常识问题,科普类问题等等

        2.是行业知识图谱,用自己的话来讲就是比较专业的一种,根据不同的行业不同的领域深度研究的版本,主要解决当前行业和当前领域的专业问题。

首先是通用的知识图谱

我们日常经常使用的知识图谱,主要就是面向浏览器搜索,推荐系统,还有问答系统等等业务场景。

浏览器知识图谱

        

行业知识图谱

行业知识图谱是特定的领域内的知识图谱,对不同的对象要考虑行业内中的不同级别的人员,不同人员对应的工作和业务场景不同,因而需要一定的完备性,行业的知识图谱对准确率要求极高,通常用于辅助和分析应用,有严格和丰富的数据模式,行业知识图谱中的实体通常比较多:

        

企业社交图谱查询:

基于任职、投资、专利、投标关系以企业为核心向外层扩散,形成一个网络关系图,直观的显示企业之间的联系。

        

人脉之间的关系

 基于两个用户之间的关系(例如:所在公司、同事、同学、家人)找到两者之间存在的关系。

        

辅助贷钱信息审核:

基于知识图谱数据的统一查询,会掌握用户的详细信息。避免信息不一致信息重复,信息不完整等问题。

         

企业最终持股人查询:

 基于股权投资找到持股比例最大的股东。

        

反欺诈骗货

同一个人利用多个身份去申请贷款,根据下图可以看出来。A,B,C之前没有直接的关系,但是通过图可以看出三者之间都共享同一部分的信息,存在一定的骗货风险。

        

企业发展历程时(融资)

基于企业知识图谱中的投融资事件发生的时间顺序,记录企业的融资发展历程。

                

竞品分析

两家企业知识路径相同,竞争关系就越紧张:

        

征信系统

根据用户已以有的信息(例如:身份证信息,联系方式,担保人,学历,被担保人信息)关联多家平台的信息记录。

        

 建设一个知识图谱系统,需要包括:知识建模、知识获取、知识融合、知识存储和知识应用五大部分组成:

1.知识建模:构建的多层级知识体系,将抽象的知识、属性、关系等信息,进行定义,组织、管理,转化成现实的数据库。

2.知识获取:将不同来源、不同结构的数据转化成图谱数据,包括结构化数据、半结构化数据、知识标引、知识推理等,保障数据的有效性和完整性。

3.知识融合:将多个来源、重复的知识信息进行融合,包括融合计算、融合计算引擎、手动操作融合等。

4.知识存储:根据业务场景提供合理的知识存储方法,存储方法应具备灵活、多样化、可拓展性。

5.知识应用:为构建好的知识图谱提供图谱检索、知识计算、图谱可视化的一些分析和应用能力。并提供各类知识计算的SDK(软件开发工具),包含图谱基础的应用类、图谱结构分析类、图谱语义应用类、自然语言处理类、图数据获取类、图谱的统计类、数据集获取数据类、数据集统计类等一些。

                

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>