知识图谱
从零基础到专家:知识表示与数据模型、本体与 Schema、构建与存储、推理与补全、应用与系统、进阶与前沿。按章节系统学习。
-
1
开篇:什么是知识图谱、为何要系统学习
知识图谱的定义与核心特征;与数据库、搜索引擎的区别;从 Google Knowledge Graph 到企业级应用;零基础学习路径与本课程结构。
-
2
从语义网到知识图谱:简史与演变
语义网愿景与 W3C 标准;关联数据运动;知识图谱概念的兴起与工业界落地;当前生态:学术与开源、商业产品。
-
3
知识图谱的应用场景与价值
搜索增强、智能问答、推荐系统、决策支持、风控与合规;行业案例:金融、医疗、电商、政务;从场景反推能力要求。
-
4
知识表示基础:实体、关系与三元组
实体(Entity)与关系(Relation)的直观理解;三元组(Subject-Predicate-Object)模型;属性与关系的区别;多跳与路径。
-
5
图与网络:图论视角下的知识
图的基本概念:节点、边、有向/无向、标签;知识图谱作为有向标注图;度、路径、连通分量;图算法在 KG 中的位置。
-
6
RDF 与三元组数据模型
RDF 数据模型与抽象语法;IRI/URI 与字面量;RDF 序列化:Turtle、RDF/XML、JSON-LD;空白节点与命名图(Named Graph)。
-
7
属性图与 RDF 的对比与选型
属性图模型:节点与边上的键值对;Neo4j 与 TinkerPop;RDF 与属性图在表达力、查询、生态上的对比;选型考量。
-
8
本体与分类:从 Taxonomy 到 Ontology
分类法(Taxonomy)与本体(Ontology)的区别;本体的作用:共享语义、推理与约束;领域本体与上层本体。
-
9
RDFS 与 OWL 入门
RDFS:类、子类、属性、定义域与值域;OWL 简述:等价、逆、传递、对称、基数约束;何时用 RDFS、何时用 OWL。
-
10
Schema 设计:实体类型与关系类型
类型体系设计原则;实体类型(Class)的划分与层次;关系类型(Property)的命名与定义域/值域;Schema 与数据的一致性。
-
11
身份与 URI 设计、命名空间
实体的全局唯一标识;URI 设计规范与命名空间;可解析 URI 与不可解析标识符;版本与持久化策略。
-
12
实体识别与抽取
从非结构化文本中识别实体;基于规则与词典的方法;命名实体识别(NER)与序列标注;领域适配与少样本。
-
13
关系抽取方法
关系抽取任务定义;基于模式与依存的方法;监督、远程监督与零样本关系抽取;关系分类与开放关系。
-
14
实体链接与消歧
实体链接:指称到知识库实体的映射;候选生成与排序;歧义与 NIL 处理;跨文档、跨语言实体链接。
-
15
知识融合与对齐
多源知识的冲突与冗余;实体对齐(Entity Alignment)与本体匹配;属性融合与真值发现;融合流水线设计。
-
16
知识图谱构建流水线
从原始数据到可用的 KG:抽取、融合、存储、质量管控;人机协同与众包;流水线工具与工程实践。
-
17
开放知识库:Wikidata、DBpedia 等
Wikidata 的结构与查询;DBpedia 抽取与本体;YAGO、Freebase 等;如何复用开放 KG 与与自建 KG 的融合。
-
18
图数据库与三元组存储
三元组存储(Triple Store)与图数据库的定位;主流产品:Virtuoso、Blazegraph、Neo4j、Nebula 等;存储模型与索引。
-
19
SPARQL 基础
SPARQL 查询语言概述;SELECT、CONSTRUCT、ASK、DESCRIBE;基本图模式(BGP)与 FILTER、OPTIONAL;FROM 与命名图。
-
20
SPARQL 进阶与联邦查询
聚合、子查询、属性路径;SPARQL 1.1:联邦查询(SERVICE)、更新;查询优化与常见陷阱。
-
21
属性图查询:Cypher 与 Gremlin
Cypher 语法:MATCH、WHERE、RETURN、CREATE;Gremlin 遍历与图计算;与 SPARQL 的思维差异与选型。
-
22
存储选型与性能优化
规模、查询模式与一致性要求下的选型;索引策略与物理设计;分布式与水平扩展;与业务系统的集成方式。
-
23
规则与推理基础
基于规则的推理:前向与后向链;规则语言与引擎;推理在 KG 中的应用:补全、一致性检查。
-
24
本体推理与描述逻辑
描述逻辑(DL)与 OWL 的对应;可满足性与分类;推理机:HermiT、Pellet、RDFox 等;推理的复杂度与可扩展性。
-
25
知识图谱补全与链接预测
链接预测任务:预测缺失的三元组;基于规则与基于表示学习的方法;评估指标:MRR、Hit@k;负采样与开放世界假设。
-
26
表示学习与嵌入
知识图谱嵌入(KGE):TransE、RotatE、ComplEx 等;嵌入用于补全、检索与下游任务;与预训练语言模型的结合。
-
27
知识图谱在搜索与问答中的应用
搜索中的实体卡片与知识面板;知识库问答(KBQA):语义解析、信息检索与生成式方法;多跳推理与可解释性。
-
28
推荐与决策支持
基于 KG 的推荐:路径、嵌入与图神经网络;决策支持:溯源、解释与合规;与 BI、规则引擎的协同。
-
29
企业知识图谱实践
企业 KG 的典型形态:主数据、文档知识、领域本体;从 POC 到生产:团队、流程与治理;ROI 与度量。
-
30
知识图谱与 NLP 的融合
预训练模型与 KG 的联合:注入、对齐与联合推理;信息抽取流水线中的 KG;文本与图的多模态表示。
-
31
大规模知识图谱系统架构
十亿级三元组的存储与查询;批处理与增量更新;图计算与图学习平台;高可用与运维。
-
32
时序知识图谱与溯源
时间维度:有效时间与事务时间;时序 KG 与事件图谱;溯源(Provenance):来源、置信度与版本。
-
33
多模态与跨语言知识图谱
图像、表格等多模态知识的融入;跨语言 KG 与实体对齐;多语言查询与应用。
-
34
知识图谱与大语言模型
LLM 与 KG 的互补:幻觉缓解与可解释性;RAG 中的 KG;从文本到 KG 的自动构建;KG 增强的 Agent。
-
35
质量评估与持续演进
准确性、完整性、一致性、时效性等维度;评估方法与基准数据集;质量监控与迭代改进;Schema 演进策略。
-
36
从工程师到知识图谱专家:路线图与进阶
知识图谱岗位与能力模型;学术与工业资源;本课程回顾与进阶方向:研究、架构、领域深耕。