知识图谱在搜索与问答中的应用
一、搜索中的实体卡片与知识面板
在通用或垂直搜索中,当查询对应到知识图谱中的实体时,结果页可展示实体卡片(Entity Card)或知识面板(Knowledge Panel):聚合该实体的名称、类型、摘要、关键属性(如出生日期、籍贯、职业)、关系列表(如「获奖」「任职」)以及相关实体链接。数据来源通常是自建或开放 KG(如 Wikidata),通过实体链接将查询与实体 ID 对应,再按模板或配置拉取属性与关系并渲染。
设计要点:信息层级——核心属性优先、长文本折叠;溯源与更新——标注数据来源与更新时间;多端适配——桌面侧栏、移动卡片、语音摘要等。实体卡片既能提升「即搜即得」的体验,也把 KG 的价值直接暴露给用户。
二、知识库问答(KBQA):三种范式
知识库问答(KBQA)的任务是:给定自然语言问句与知识库,返回答案(实体、属性值或列表)。主流方法可归纳为三类。
语义解析(Semantic Parsing):将问句解析为结构化查询(如 SPARQL、逻辑形式、Lambda 表达式),在 KG 上执行查询得到答案。需要问句→逻辑的解析器(规则、文法或神经网络),以及实体/关系的链接与消歧。优点是可精确执行复杂查询;缺点是对新问法、新实体需要标注或泛化。
信息检索(Information Retrieval):先识别问句中的主题实体,从 KG 中检索相关子图(一跳或多跳邻居),再用分类或阅读理解模型从子图中抽取答案。不显式生成 SPARQL,适合开放域、答案形式多样;难点在于子图规模与答案抽取的准确性。
生成式(Generative):用大语言模型(LLM)根据问句与检索到的 KG 片段(或三元组描述)直接生成答案。可结合检索增强(RAG):先检索相关实体与三元组,再喂给 LLM 生成自然语言答案。灵活、易扩展,但需控制幻觉与溯源。
Semantic parsing
Question → logical form (SPARQL); execute on KG. Precise, needs parser and linking.
Information retrieval
Topic entity → subgraph → extract answer. No explicit query; scalable, diverse answers.
Generative
Retrieve KG triples + LLM → generate answer. RAG-style; flexible, watch hallucination.
三、多跳推理与可解释性
许多问题需要多跳推理:答案不能由单一实体或一跳关系得到,而要沿 KG 走多步(如「A 的创始人创办的公司的总部在哪」需要 A→创始人→公司→总部)。方法上可结合多跳路径搜索、子图推理、或链式推理模型(每步预测下一跳实体/关系),也可用嵌入或 GNN 做多跳路径排序。
可解释性:用户与业务往往希望知道「答案从哪来」。可解释方式包括:展示推理路径——把从问题实体到答案实体经过的边与中间节点呈现出来;高亮支撑三元组——标出被模型或查询用到的三元组;自然语言解释——用模板或生成模型把路径转成短句(如「因为 A 的创始人是 B,B 创办了 C,C 的总部在 D」)。可解释性有助于纠错、合规与用户信任。
多跳与可解释性小结
Multi-hop: path search, chain reasoning, or path ranking over KG. Explainability: show path, highlight supporting triples, or generate NL explanation.
一句话: 搜索中用 KG 支撑实体卡片与知识面板,查询经实体链接后拉取属性与关系展示。KBQA有三种范式:语义解析(问句→SPARQL→执行)、信息检索(实体+子图→抽取答案)、生成式(检索+LLM→生成)。多跳推理需沿图多步;可解释性通过展示推理路径、支撑三元组或自然语言解释实现。
四、小结
搜索中的实体卡片与知识面板依赖 KG 与实体链接。KBQA有语义解析、信息检索与生成式三种范式,可按精度、规模与可解释性需求选型。多跳推理依赖路径搜索或链式推理;可解释性通过路径展示与支撑三元组提升信任。下一章讲推荐与决策支持:基于 KG 的推荐、溯源与解释、与 BI 的协同。