知识图谱

从零基础到专家:知识表示与数据模型、本体与 Schema、构建与存储、推理与补全、应用与系统、进阶与前沿。按章节系统学习。

  1. 1

    开篇:什么是知识图谱、为何要系统学习

    知识图谱的定义与核心特征;与数据库、搜索引擎的区别;从 Google Knowledge Graph 到企业级应用;零基础学习路径与本课程结构。

  2. 2

    从语义网到知识图谱:简史与演变

    语义网愿景与 W3C 标准;关联数据运动;知识图谱概念的兴起与工业界落地;当前生态:学术与开源、商业产品。

  3. 3

    知识图谱的应用场景与价值

    搜索增强、智能问答、推荐系统、决策支持、风控与合规;行业案例:金融、医疗、电商、政务;从场景反推能力要求。

  4. 4

    知识表示基础:实体、关系与三元组

    实体(Entity)与关系(Relation)的直观理解;三元组(Subject-Predicate-Object)模型;属性与关系的区别;多跳与路径。

  5. 5

    图与网络:图论视角下的知识

    图的基本概念:节点、边、有向/无向、标签;知识图谱作为有向标注图;度、路径、连通分量;图算法在 KG 中的位置。

  6. 6

    RDF 与三元组数据模型

    RDF 数据模型与抽象语法;IRI/URI 与字面量;RDF 序列化:Turtle、RDF/XML、JSON-LD;空白节点与命名图(Named Graph)。

  7. 7

    属性图与 RDF 的对比与选型

    属性图模型:节点与边上的键值对;Neo4j 与 TinkerPop;RDF 与属性图在表达力、查询、生态上的对比;选型考量。

  8. 8

    本体与分类:从 Taxonomy 到 Ontology

    分类法(Taxonomy)与本体(Ontology)的区别;本体的作用:共享语义、推理与约束;领域本体与上层本体。

  9. 9

    RDFS 与 OWL 入门

    RDFS:类、子类、属性、定义域与值域;OWL 简述:等价、逆、传递、对称、基数约束;何时用 RDFS、何时用 OWL。

  10. 10

    Schema 设计:实体类型与关系类型

    类型体系设计原则;实体类型(Class)的划分与层次;关系类型(Property)的命名与定义域/值域;Schema 与数据的一致性。

  11. 11

    身份与 URI 设计、命名空间

    实体的全局唯一标识;URI 设计规范与命名空间;可解析 URI 与不可解析标识符;版本与持久化策略。

  12. 12

    实体识别与抽取

    从非结构化文本中识别实体;基于规则与词典的方法;命名实体识别(NER)与序列标注;领域适配与少样本。

  13. 13

    关系抽取方法

    关系抽取任务定义;基于模式与依存的方法;监督、远程监督与零样本关系抽取;关系分类与开放关系。

  14. 14

    实体链接与消歧

    实体链接:指称到知识库实体的映射;候选生成与排序;歧义与 NIL 处理;跨文档、跨语言实体链接。

  15. 15

    知识融合与对齐

    多源知识的冲突与冗余;实体对齐(Entity Alignment)与本体匹配;属性融合与真值发现;融合流水线设计。

  16. 16

    知识图谱构建流水线

    从原始数据到可用的 KG:抽取、融合、存储、质量管控;人机协同与众包;流水线工具与工程实践。

  17. 17

    开放知识库:Wikidata、DBpedia 等

    Wikidata 的结构与查询;DBpedia 抽取与本体;YAGO、Freebase 等;如何复用开放 KG 与与自建 KG 的融合。

  18. 18

    图数据库与三元组存储

    三元组存储(Triple Store)与图数据库的定位;主流产品:Virtuoso、Blazegraph、Neo4j、Nebula 等;存储模型与索引。

  19. 19

    SPARQL 基础

    SPARQL 查询语言概述;SELECT、CONSTRUCT、ASK、DESCRIBE;基本图模式(BGP)与 FILTER、OPTIONAL;FROM 与命名图。

  20. 20

    SPARQL 进阶与联邦查询

    聚合、子查询、属性路径;SPARQL 1.1:联邦查询(SERVICE)、更新;查询优化与常见陷阱。

  21. 21

    属性图查询:Cypher 与 Gremlin

    Cypher 语法:MATCH、WHERE、RETURN、CREATE;Gremlin 遍历与图计算;与 SPARQL 的思维差异与选型。

  22. 22

    存储选型与性能优化

    规模、查询模式与一致性要求下的选型;索引策略与物理设计;分布式与水平扩展;与业务系统的集成方式。

  23. 23

    规则与推理基础

    基于规则的推理:前向与后向链;规则语言与引擎;推理在 KG 中的应用:补全、一致性检查。

  24. 24

    本体推理与描述逻辑

    描述逻辑(DL)与 OWL 的对应;可满足性与分类;推理机:HermiT、Pellet、RDFox 等;推理的复杂度与可扩展性。

  25. 25

    知识图谱补全与链接预测

    链接预测任务:预测缺失的三元组;基于规则与基于表示学习的方法;评估指标:MRR、Hit@k;负采样与开放世界假设。

  26. 26

    表示学习与嵌入

    知识图谱嵌入(KGE):TransE、RotatE、ComplEx 等;嵌入用于补全、检索与下游任务;与预训练语言模型的结合。

  27. 27

    知识图谱在搜索与问答中的应用

    搜索中的实体卡片与知识面板;知识库问答(KBQA):语义解析、信息检索与生成式方法;多跳推理与可解释性。

  28. 28

    推荐与决策支持

    基于 KG 的推荐:路径、嵌入与图神经网络;决策支持:溯源、解释与合规;与 BI、规则引擎的协同。

  29. 29

    企业知识图谱实践

    企业 KG 的典型形态:主数据、文档知识、领域本体;从 POC 到生产:团队、流程与治理;ROI 与度量。

  30. 30

    知识图谱与 NLP 的融合

    预训练模型与 KG 的联合:注入、对齐与联合推理;信息抽取流水线中的 KG;文本与图的多模态表示。

  31. 31

    大规模知识图谱系统架构

    十亿级三元组的存储与查询;批处理与增量更新;图计算与图学习平台;高可用与运维。

  32. 32

    时序知识图谱与溯源

    时间维度:有效时间与事务时间;时序 KG 与事件图谱;溯源(Provenance):来源、置信度与版本。

  33. 33

    多模态与跨语言知识图谱

    图像、表格等多模态知识的融入;跨语言 KG 与实体对齐;多语言查询与应用。

  34. 34

    知识图谱与大语言模型

    LLM 与 KG 的互补:幻觉缓解与可解释性;RAG 中的 KG;从文本到 KG 的自动构建;KG 增强的 Agent。

  35. 35

    质量评估与持续演进

    准确性、完整性、一致性、时效性等维度;评估方法与基准数据集;质量监控与迭代改进;Schema 演进策略。

  36. 36

    从工程师到知识图谱专家:路线图与进阶

    知识图谱岗位与能力模型;学术与工业资源;本课程回顾与进阶方向:研究、架构、领域深耕。