【资料图】
大数据文摘授权转载自专知 知识图谱推理(Knowledge graph reasoning, KGR)旨在从知识图谱(Knowledge graphs, KGs)中挖掘出逻辑规则,从已有事实中推理出新的事实,已成为一个快速发展的研究方向。事实证明,知识图谱在许多人工智能应用中可以显著受益,如问答和推荐系统等。根据图的类型,现有的KGR模型大致可以分为静态模型、时序模型和多模态模型3类。该领域的早期工作主要集中在静态KGR上,倾向于将通用的知识图谱嵌入模型直接应用于推理任务。然而,这些模型并不适用于更复杂但实用的任务,如归纳静态KGR、时序KGR和多模态KGR。 为此,近年来开展了多项工作,但尚未有综述性论文和开源库对这一重要方向的模型进行全面的总结和讨论。为填补这一空白,从静态知识图谱到时序知识图谱再到多模态知识图谱,对知识图谱推理的研究进展进行了综述,介绍了知识图谱推理模型的初步研究进展,总结了知识图谱推理的典型数据集。此外,我们还讨论了面临的挑战和潜在的机遇。对应的开源存储库共享在GitHub: https://github.com/LIANGKE23/Awesome-Knowledge-Graph-Reasoning上。 https://www.zhuanzhi.ai/paper/6072f9e070b00222636308216e909e54
引言
人类学习技能有两个主要来源,即专业书籍和工作经验。例如,一个好医生需要从学校获得知识,从医院获得实践经验。然而,现有的人工智能模型大多只从经验中模仿学习过程,而忽略了经验中的学习过程,使得模型的可解释性较差,性能也不够理想。知识图谱(knowledge graphs, KGs)以直观的图结构[1],[2],[3]存储人类知识事实,可作为提供特定领域知识的书籍,因此被许多研究者视为潜在的解决方案。 为了利用知识图谱中的先验知识,知识图谱推理(knowledge graph reasoning,简称KGR)近年来受到了越来越多的关注。具体来说,KGR模型旨在从已有事实中推导出(A,父,B)∧(A,夫,C)→(C,母,B)的逻辑规则,从而推断出图1 (A)中的新事实(Savannah,母,Bronny)。实验证明,KGR模型在问答[4]、推荐系统[5]、信息提取[6]、图像分类[7]等应用中显著提高了知识图谱的使用效率。 根据图谱类型(见图1),知识图谱推理可分为静态KGR、时序KGR和多模态KGR 3类。早期工作主要关注静态知识图谱,并倾向于直接将通用知识图谱嵌入(KGE)模型应用于推理任务,这显示了转导场景中静态知识图谱嵌入的巨大潜力。然而,对于更复杂但实用的任务,如归纳静态KGR、时序KGR和多模态KGR,它们的表达能力受到限制。请注意,直推式和归纳式是与静态KGR相关的两种不同的推理场景,定义见第2.2节。为了解决这些问题,近年来提出了多种KGR模型。例如,GraIL[8]首先进行基于图神经网络(GNNs)的归纳推理,并以此为基础提出了许多相关工作。此外,循环神经网络(RNN)与GNN模型广泛集成,以更好地表达时域KGR[9]、[10]、[11]的时间信息。 有几篇关于KGR任务的综述论文。例如,[12]首先将KGR分为符号推理和统计推理,而[13]进一步将模型归纳为符号推理、神经推理和混合推理3种类型。随后,[14]和[15]在基于逻辑和基于嵌入的KGR模型中提出了更细粒度的分类。然而,这些工作仅关注静态KGR,而忽略了最近的进展,特别是在时态和多模态KGR领域。此外,它们都没有讨论所述KGR模型的推理场景,即直推式、归纳式、插值式和外推式。为填补这一空白,本文对知识图谱推理进行了综述,从静态到时序再到多模态知识图谱。然后,根据知识图谱类型对近年来KGR模型和典型数据集进行了系统综述;注意,还对所审阅的模型进行了推理场景的讨论。最后总结了面临的挑战和潜在的机遇。我们的主要贡献如下: 全面综述。系统地回顾了161种知识图谱推理模型,是其他模型的3倍多,并根据知识图谱的类型,全面收集了67个典型数据集,即静态知识图谱、时序知识图谱和多模态知识图谱。此外,还分析了所述模型的推理技术和场景。据我们所知,这是第一个以图类型和推理场景为标准来回顾模型的综述。 深刻的分析。分析了现有KGR模型的优缺点及其适用范围,为读者研究基线的选择提供有益的指导。 潜在的机会。文中总结了知识图谱推理面临的挑战,并指出了一些潜在的机遇,可能对读者有所启发。 开源资源。我们在GitHub上分享了最先进的KGR模型和相关数据集:https://github.com/LIANGKE23/Awesome-KnowledgeGraph-Reasoning。 本次综述的结构组织如图2所示。第二章简要介绍了预审结果。然后,第3节对不同KG类型的SOTA KGR模型进行了全面回顾。在此之后,第4节列出了典型的基准KGR数据集。稍后,我们将在第5节讨论KGR面临的一些挑战和机遇。最后,第六章对全文进行了总结。 知识图推理模型
对161种知识图谱推理(KGR)模型进行了全面的综述。具体地,根据知识图谱类型,即静态知识图谱、时序知识图谱和多模态知识图谱,总结了KGR模型; 静态 KGR模型 首先系统地介绍了88个静态KGR模型。然后,根据推理场景对综述模型进行分类;静态KGR模型的分类如图6所示。 基于嵌入的模型根据已有的事实三元组学习嵌入向量,然后根据评分函数计算的似然分数对前k个候选事实进行排序。大多数数量中有三种类型,即平移模型,张量分解模型和神经网络模型。根据我们的观察,基于嵌入的模型比其他模型多得多。因此,图7给出了模型的时间轴,以便清晰地展示。 表2:静态知识图推理模型总结。
时序知识图谱推理 首先,系统地介绍了50种时态KGR模型,根据它们如何整合时间信息;然后,根据推理场景对综述模型进行分类;时序KGR模型的分类如图8所示 多模态KGR模型 现有的多模态KGR模型一般采用基于嵌入的推理模型,融合文本、图像等多模态辅助特征后推断出被查询的事实。由于缺乏融合模块,将静态和时序KGR模型直接应用于多模态KGR任务通常会导致性能次优。作为一个早期的研究领域,相关的工作还不够系统[164],[165],[166]。为此,本节只全面回顾了沿时间轴的23个典型多模态KGR模型(见图9)。 数据集
经验表明,没有针对KGR任务的全面数据集,特别是时间知识图谱和多模态知识图谱。为了更好地方便社区,我们全面地总结了数据集,并系统地提供了它们的统计数据。 机会与挑战
4.1 分布外推理 在现实场景中,知识图谱中不断出现新的实体和关系,而这些实体和关系在原知识图谱中还未被充分挖掘,利用这些未被挖掘的元素对事实进行推理称为分布外推理,这对知识图谱模型的设计提出了更高的要求。最近的一些尝试为推理未见过的实体提供了潜在的解决方案,称为归纳推理模型,如[7],[70],[71],[73]。这些模型挖掘图结构背后的逻辑规则,没有考虑实体的具体含义,取得了较好的效果。对于未见过的关系推理,少样本KGR模型[72]、[86]、[121]倾向于提高模型的泛化能力,使得训练好的模型可以很好地扩展到具有少量事实的未见关系。换句话说,这些小样本KGR模型可以根据之前学习到的相似知识快速学习新任务。此外,BERTRL[84]试图根据语言模型计算出的文本语义来处理这种情况。而当语言模型没有经过精细训练时,这些模型的性能会急剧下降。综上所述,面向分布外推理任务的KGR模型仍处于早期阶段,值得未来深入探索。 4.2 大规模推理 工业领域的知识图谱通常是大规模的,这就需要更高效的知识图谱模型。为此,现有的一些工作试图以渐进的方式优化传播过程[242]。例如,NBF-net[81]集成了bellman-ford算法,以替代基于GNN的KGR模型中原始的基于dfs的聚合过程。此外,∗Star[242]网络使用贪婪算法进一步优化聚合过程。此外,图聚类的思想[243],[244],[245]也被用于它。例如,CURL[93]首先根据实体语义将KGs分成不同的簇,然后将路径搜索过程细化为两级,即簇内级和簇间级。它减少了对整个图的不必要搜索。同样,许多工作是在子图上进行推理,而不是在完全图上进行推理,如GraIL [7], CSR[86]等。但其中大多数牺牲了推理的精度,对于更全面的模型,仍然可以探索推理的精度。 4.3多关系推理 multi-relational事实两个实体之间存在的情况是常见的KG如图11所示(一个)。然而,他们更多样的结构和更复杂的语义uni-relational和bi-relational事实相比,如图11所示(b)和(c)。因此,现有KGR模型主要关注uni-relational bi-relational事实甚至通常对待multi-relational事实uni-relational和bi-relational省略一些事实的事实。这样的KGR模型不能准确地建模真实情况,丢失了大量有意义的语义信息,导致表达能力不足。未来需要研究如何利用多关系事实来提高推理能力。 4.4多模态推理 基于多源信息融合的知识推理可以通过结合文本语料库或其他模态中的附加信息来降低知识图谱的脱节和稀疏性。基于多模态数据融合的知识推理可以实现优势互补,提高推理性能。然而,现有的多模态KGR模型仍处于早期阶段。他们仍然倾向于直接将不同模态的嵌入连接在一起以进行最终得分计算。这些简单的融合模式已经显示出了良好的性能,而开发更细粒度和可扩展的模式仍然是有价值的。例如,权衡不同模态重要性的自适应融合模式值得探索。 4.5可解释推理 可解释性是各个领域深度学习模型普遍存在的重要问题。虽然KGR模型通常更易于解释,但在这个主题中仍然值得进行更多的探索,特别是基于嵌入的KGR模型。目前,越来越多的KGR模型基于神经网络,如GNN。他们中的大多数具有很强的表达能力,但缺乏可解释性。相比之下,基于规则和基于路径的KGR模型可解释性强,但计算量大,表达能力弱。为了在表达能力和可解释性之间取得良好的权衡,有一些尝试将基于嵌入的模型与基于规则和基于路径的模型相结合,如ARGCN[192]。它基于RGCN[57]生成的嵌入构建奖励函数,这使那些基于路径的模型更具解释性。然而,大多数这些尝试仍然很艰难。 4.6知识图谱推理应用 虽然近年来提出了大量的KGR方法,展示了KGR在理论领域的巨大潜力,但其应用还需要更多的研究。目前,知识图谱被广泛应用于医学、金融、抄袭检测等领域。医学知识推理模型旨在辅助医生从电子病历中进行疾病诊断。例如,[246]和[247]都对从电子医疗数据库构建的KG进行推理。利用Bert等预训练语言模型来生成实体的文本嵌入,这在现有的多模态KGR模型中被证明是有效的。此外,KGR模型还可以帮助反欺诈检测,这是金融领域的一项重要任务。例如,[248]提出了一种基于案例推理的方法来帮助人们对信息进行验证,以提前区分欺诈。此外,[249]通过持续学习的方式进行KGR方法来执行抄袭检测。
推荐内容
-
全球最资讯丨国防科大最新综述论文,全面阐述知识图谱推理技术进展
-
微动态丨在一篇由GPT-3生成的论文中,ChatGPT重现了图灵测试的原始论文
-
基于太赫兹波段的负曲率轨道角动量光纤
-
联讯总经理李建征入选广州市会展和数字经济知识产权保护中心专家库
-
世界视点!数据可视化实用干货分享
-
环球最新:增长分析产品入选《2022中国数字化转型与创新评选》榜单
-
热点!张溪梦谈与奇点云合并:借助数据云,分析云实现了全域能力|36氪Pro
-
信息:特斯拉可玩上千Steam游戏/ Waymo防撞测试结果不输人类/ Twitter欲强制开启个性化广告…今日更多新鲜事在此
-
全球观点:量子位揭2022人工智能年度公司&人物榜单,深兰科技同时入选
-
美象科技:以「数字孪生技术」赋能数字经济,连接「虚拟与现实」| 镁客·请讲
-
全球观天下!符合人类创作过程的AIGC:自动生成长故事的模型出现了
-
全球快看点丨从“围观”到“交朋友”,皮皮App线上派对打破互动壁垒
-
2024年,苹果将允许开发者在欧洲上架第三方商店
-
每日热讯!亲测ChatGPT写文章,我终于感受到了被元宇宙攻陷的未来
-
大厂追逐AI绘画新风口:热闹、流量和变现想象力
-
IAA品类洞察:扫描品类加快变现,如何抓住增长机遇?
-
全球微动态丨NFT2.0:探索NFT未来发展之路
-
天天热文:中国广电云南2022任务进展
-
【聚看点】总预算240万元,中广电移动启动项目管理系统一期工程项目招标
-
天天热资讯!航天宏图全自动建模软件:PIE-Smart 下载
-
全球实时:2022年11月VR/AR行业月报 | VR陀螺
-
世界快看点丨中国移动杨慰民:自智网络实现L3自动化闭环,将向L4智能化闭环演进
-
全球讯息:电信与联通在广东开通全国首个共建共享低频5G基站
-
山东济南:到2025年培育100家以上元宇宙企业
-
今日热文:数字化转型,越务实越成功
-
环球最新:用友BIP项目云,让服务类项目管理如此敏捷
-
云游戏拉开产业化大幕
-
焦点速递!这些车企在企业微信里,装上高速的“组织引擎”
-
焦点速讯:香港证券交易所首批BTC和ETH期货ETF登场,12月16日挂牌上市交易
-
全球观焦点:“AI换脸”不能想换就换,深度合成技术新规落地
-
全球快资讯:130亿美元!Meta或再收天价罚单,下一个轮到谁?
-
谷歌启动ARCore地理空间API挑战赛;索尼新专利显示其或正在开发AR游戏
-
今日聚焦!元宇宙现金订单频繁落地,炒概念终于回归业绩本身
-
当前速讯:蔡进:以数字化平台链接上下游企业是目前的一大趋势
-
环球信息:清华大学互联网产业研究院平台经济首席专家平庆忠:网上商城是企业数字供应链建设的基础
-
每日快讯!高途在广州成立科技公司 注册资本6000万
-
【世界速看料】我用 AI 工作了两天,它说他想灭绝人类。。
-
每日快播:连连数字“超级工牌”产品正式发布,助力企业员工服务智能升级
-
当前视讯!AI绘画,正在量产艺术家?
-
环球快讯:除了内卷 ,ChatGPT能为游戏行业带来什么?
-
焦点消息!ERP的建立一定要实现这五个自动化,不然就是忽悠
-
环球今日讯!中国广电集团发文表彰江苏有线5G放号规模突破50万
-
守护家庭上网安全,电信有个“安全管家”!
-
环球观察:2022年,人工智能领域发展的七大趋势有哪些?
-
环球观点:AI写剧本炸场戏剧节!DeepMind出品,马斯克看了直夸,网友看到接口悟了
-
“谢谢你,百度侠”又玩出了什么新潮花样?
-
【播资讯】AI编程登上Science封面:AlphaCode打竞赛,三分之二赛题一遍过,成绩超过一半程序员
-
今日关注:AI大模型加持,生成式搜索来了!
-
用友BIP推出多个安全管理服务,助力涉密企业构筑信息安全防线
-
天天快讯:从虚拟主播的成长故事,看抖音直播的多元化生态
-
微动态丨在一篇由GPT-3生成的论文中,ChatGPT重现了图灵测试的原始论文
-
基于太赫兹波段的负曲率轨道角动量光纤
-
全球最资讯丨国防科大最新综述论文,全面阐述知识图谱推理技术进展
-
当前视点!遭疯抢的电解质水,收割了谁?
-
今日视点:融资丨「华先医药」完成超亿元的B+轮融资,粤科珠西(粤科集团)、拓为中汇联合领投
-
环球讯息:不看门店,资本看上了餐饮“打工人”?
-
今日讯!黑马频出,中式汉堡硝烟渐起
-
【天天播资讯】正午的阳光不刺眼了
-
博思得c168打印教程是什么?博思得e58标签打印机怎么安装?
-
电脑突然蓝屏是什么原因导致的?电脑无缘无故蓝屏如何修复?
-
苹果笔记本进不去系统?苹果笔记本重装系统教程是什么?
-
电脑中丢失dll文件怎么办?win7电脑丢失dll文件怎么恢复?
-
u盘无法读取也不能格式化?u盘无法格式化有写保护怎么办?
-
科达视频会议终端密码找回?科达视频会议模板?
-
电脑连不上网显示黄色感叹号?电脑wifi已连接但有感叹号?
-
苹果12死机强制重启按什么键?苹果12手机失灵了如何强制关机?
-
怎么远程修改路由器密码?怎样修改无线路由器密码?
-
电脑连不上网是怎么回事?电脑连不上网了怎么办教程是什么?
-
电脑突然蓝屏出现英文无法重启?电脑蓝屏关机自动重启?
-
世界视点!数据可视化实用干货分享
-
联讯总经理李建征入选广州市会展和数字经济知识产权保护中心专家库
-
环球最新:增长分析产品入选《2022中国数字化转型与创新评选》榜单
-
热点!张溪梦谈与奇点云合并:借助数据云,分析云实现了全域能力|36氪Pro
-
世界报道:携程回暖,尚需时日
-
全球今日讯!虎头局开放加盟,筹备出海,连锁小吃的春天又来了?
-
世界看热讯:中国打工人,“掘金”卡塔尔
-
全球热推荐:「辣条第一股」弄丢了多少人的信心?
-
这三年离开职场的人,现在怎么样了?
-
水果自由的「锅」,百果园和洪九果品谁来背?
-
信息:特斯拉可玩上千Steam游戏/ Waymo防撞测试结果不输人类/ Twitter欲强制开启个性化广告…今日更多新鲜事在此
-
美象科技:以「数字孪生技术」赋能数字经济,连接「虚拟与现实」| 镁客·请讲
-
全球观点:量子位揭2022人工智能年度公司&人物榜单,深兰科技同时入选
-
全球观天下!符合人类创作过程的AIGC:自动生成长故事的模型出现了
-
2024年,苹果将允许开发者在欧洲上架第三方商店
-
每日热讯!亲测ChatGPT写文章,我终于感受到了被元宇宙攻陷的未来
-
全球快看点丨从“围观”到“交朋友”,皮皮App线上派对打破互动壁垒
-
大厂追逐AI绘画新风口:热闹、流量和变现想象力
-
IAA品类洞察:扫描品类加快变现,如何抓住增长机遇?
-
融资丨「Fabrie」完成Pre-A+轮融资,鼎晖VGC投资、红杉中国种子基金共同领投
-
精选!融资丨「燃麦科技」完成千万美元A轮融资,BAI资本领投
-
【全球新要闻】融资丨「特看科技」完成数千万元人民币天使轮融资,峰瑞资本领投
-
前沿资讯!餐饮抄底,要趁早
-
融资丨「卓世科技」完成4000万人民币A+轮融资,用友旗下融道资本领投
-
全球微动态丨NFT2.0:探索NFT未来发展之路
-
钠电池还没赢,上市公司先赢麻了
-
天天热点评!CEO“博眼球”,解不了智己的焦虑
-
牙齿隐形矫治:如何将“塑料”卖出黄金价格?
-
天天热资讯!航天宏图全自动建模软件:PIE-Smart 下载
-
世界快看点丨中国移动杨慰民:自智网络实现L3自动化闭环,将向L4智能化闭环演进
-
【聚看点】总预算240万元,中广电移动启动项目管理系统一期工程项目招标
-
天天热文:中国广电云南2022任务进展
-
全球实时:2022年11月VR/AR行业月报 | VR陀螺
-
当前视讯!宝马计划明年在华推11款纯电车,还用油改电糊弄人?
-
中兴手机怎样打开工程模式?中兴v9网络怎么设置?
-
笔记本有线网卡和无线网卡的区别是什么?有线网卡和无线网卡有什么不一样?
-
天天热点评!融资丨「中科原动力」完成A2轮融资,中金资本旗下基金领投
-
怎样查找电脑中的ie浏览器?如何寻找电脑上的ie浏览器 ?
-
Twitter“变卖家产”,休闲椅到咖啡机,起拍只要25
-
超五类双绞线都有哪些?五类超五类双绞线的辨别是什么?
-
华擎x570主板bios详解是什么?华擎主板bios恢复出厂的办法是什么?
-
内存不兼容解决方法是什么?为什么不建议装两个固态?
-
swf格式怎么播放?swf文件用什么软件打开?
-
【新视野】工业自动化向智能化转型升级,“AI+3D视觉”赋能企业降本增效
-
惠普511打印机值得买吗?惠普511打印机的缺点是什么?
-
nw336无线网卡怎样使用?无线网卡的开启方法是什么?
-
win10系统入门使用教程是什么?win10系统使用讲解有什么?
-
全球热门:身价1天涨近1亿,他凭什么成为富豪榜排名增长最快的企业家?
-
今日热闻!东南亚没有“购物节”
-
每日消息!这三年失业的人,现在怎么样了?
-
为了研究羽绒服怎么买,我们整了一份报告
-
消息!5000亿广告市场缓慢复苏
-
讯息:去寺庙打工,可以月入过万吗?
-
卤味新品牌打江山,不能只靠年轻人“追剧”
-
融资丨「睿视科技」完成5000万元人民币A轮融资,蓝驰创投、国药中金联合投资
-
环球短讯!融资丨「熊猫沫沫」获得千万级天使轮投资
-
每日简讯:融资丨「宽凳科技」获得1500万人民币A轮融资,国亿私募基金投资
-
今日热文:数字化转型,越务实越成功
-
山东济南:到2025年培育100家以上元宇宙企业
-
全球讯息:电信与联通在广东开通全国首个共建共享低频5G基站
-
融资丨「汇充电」今年已累计融资超2.4亿元
-
焦点速递!这些车企在企业微信里,装上高速的“组织引擎”
-
云游戏拉开产业化大幕
-
环球最新:用友BIP项目云,让服务类项目管理如此敏捷
-
全球观焦点:“AI换脸”不能想换就换,深度合成技术新规落地
-
焦点速讯:香港证券交易所首批BTC和ETH期货ETF登场,12月16日挂牌上市交易
-
融资丨「Molecular Axiom」完成A轮融资,深圳东方富海领投
-
谁在囤黄桃罐头?
-
2022年十大副业,要多卷有多卷
-
印度版拼多多:成就主妇,背叛主妇
-
抄底中国,这个服装巨头太狂了
-
全球快资讯:130亿美元!Meta或再收天价罚单,下一个轮到谁?
-
环球信息:清华大学互联网产业研究院平台经济首席专家平庆忠:网上商城是企业数字供应链建设的基础
-
今日聚焦!元宇宙现金订单频繁落地,炒概念终于回归业绩本身
-
当前速讯:蔡进:以数字化平台链接上下游企业是目前的一大趋势
-
谷歌启动ARCore地理空间API挑战赛;索尼新专利显示其或正在开发AR游戏
-
摩托罗拉x30质量怎么样?摩托罗拉x30很好吗?
-
qq空间怎么设置访问权限加密?qq怎么查自己的qq密码?
-
电脑进去后桌面是黑屏怎么回事?电脑开机慢反应慢怎么解决?
-
打印机硒鼓寿命耗尽怎么办?打印机硒鼓能打印多久?
-
倒车雷达驻车雷达怎么样?倒车雷达的工作原理是什么?