知识图谱在搜索与问答中的应用

第 27 章 · 知识图谱

搜索引擎里，你输入「爱因斯坦」不仅看到网页列表，还常看到右侧的实体卡片与知识面板——头像、简介、出生日期、获奖、相关人物，这些结构化信息大多来自知识图谱。知识库问答（KBQA）则更进一步：用户用自然语言提问，系统从 KG 中找出答案，方法包括语义解析（问句转成 SPARQL/逻辑形式）、信息检索（先找实体与子图再抽答案）、以及生成式（用大模型基于检索结果生成答案）。当问题需要多跳推理时，还要沿图多步推理，并做好可解释性。本章把搜索中的 KG 展示、KBQA 的三种范式、以及多跳与可解释性讲清楚。

一、搜索中的实体卡片与知识面板

在通用或垂直搜索中，当查询对应到知识图谱中的实体时，结果页可展示实体卡片（Entity Card）或知识面板（Knowledge Panel）：聚合该实体的名称、类型、摘要、关键属性（如出生日期、籍贯、职业）、关系列表（如「获奖」「任职」）以及相关实体链接。数据来源通常是自建或开放 KG（如 Wikidata），通过实体链接将查询与实体 ID 对应，再按模板或配置拉取属性与关系并渲染。

设计要点：信息层级——核心属性优先、长文本折叠；溯源与更新——标注数据来源与更新时间；多端适配——桌面侧栏、移动卡片、语音摘要等。实体卡片既能提升「即搜即得」的体验，也把 KG 的价值直接暴露给用户。

搜索中的实体卡片：查询经实体链接得到实体 ID，再从 KG 拉取属性与关系渲染为卡片/面板

二、知识库问答（KBQA）：三种范式

知识库问答（KBQA）的任务是：给定自然语言问句与知识库，返回答案（实体、属性值或列表）。主流方法可归纳为三类。

语义解析（Semantic Parsing）：将问句解析为结构化查询（如 SPARQL、逻辑形式、Lambda 表达式），在 KG 上执行查询得到答案。需要问句→逻辑的解析器（规则、文法或神经网络），以及实体/关系的链接与消歧。优点是可精确执行复杂查询；缺点是对新问法、新实体需要标注或泛化。

信息检索（Information Retrieval）：先识别问句中的主题实体，从 KG 中检索相关子图（一跳或多跳邻居），再用分类或阅读理解模型从子图中抽取答案。不显式生成 SPARQL，适合开放域、答案形式多样；难点在于子图规模与答案抽取的准确性。

生成式（Generative）：用大语言模型（LLM）根据问句与检索到的 KG 片段（或三元组描述）直接生成答案。可结合检索增强（RAG）：先检索相关实体与三元组，再喂给 LLM 生成自然语言答案。灵活、易扩展，但需控制幻觉与溯源。

Semantic parsing

Question → logical form (SPARQL); execute on KG. Precise, needs parser and linking.

Information retrieval

Topic entity → subgraph → extract answer. No explicit query; scalable, diverse answers.

Generative

Retrieve KG triples + LLM → generate answer. RAG-style; flexible, watch hallucination.

KBQA 三种范式：语义解析→执行；实体+子图→抽取；检索+LLM→生成

三、多跳推理与可解释性

许多问题需要多跳推理：答案不能由单一实体或一跳关系得到，而要沿 KG 走多步（如「A 的创始人创办的公司的总部在哪」需要 A→创始人→公司→总部）。方法上可结合多跳路径搜索、子图推理、或链式推理模型（每步预测下一跳实体/关系），也可用嵌入或 GNN 做多跳路径排序。

可解释性：用户与业务往往希望知道「答案从哪来」。可解释方式包括：展示推理路径——把从问题实体到答案实体经过的边与中间节点呈现出来；高亮支撑三元组——标出被模型或查询用到的三元组；自然语言解释——用模板或生成模型把路径转成短句（如「因为 A 的创始人是 B，B 创办了 C，C 的总部在 D」）。可解释性有助于纠错、合规与用户信任。

多跳与可解释性小结

Multi-hop: path search, chain reasoning, or path ranking over KG. Explainability: show path, highlight supporting triples, or generate NL explanation.

多跳推理：沿图 A→B→C→Answer；可解释性：展示路径与支撑三元组

一句话： 搜索中用 KG 支撑实体卡片与知识面板，查询经实体链接后拉取属性与关系展示。KBQA有三种范式：语义解析（问句→SPARQL→执行）、信息检索（实体+子图→抽取答案）、生成式（检索+LLM→生成）。多跳推理需沿图多步；可解释性通过展示推理路径、支撑三元组或自然语言解释实现。

实践： 用 SPARQL 端点或本地 KG 做一次简单 KBQA：写 3～5 个问句，分别用「语义解析」（手写或模板转 SPARQL）与「检索+抽取」（实体链接→取子图→找答案）两种方式实现，对比答案质量与实现成本；若有 LLM API，可再试「检索+生成」。

四、小结

搜索中的实体卡片与知识面板依赖 KG 与实体链接。KBQA有语义解析、信息检索与生成式三种范式，可按精度、规模与可解释性需求选型。多跳推理依赖路径搜索或链式推理；可解释性通过路径展示与支撑三元组提升信任。下一章讲推荐与决策支持：基于 KG 的推荐、溯源与解释、与 BI 的协同。