时序知识图谱与溯源
一、时间维度:有效时间与事务时间
有效时间(Valid Time):描述事实在现实世界中成立的时间。例如「张三 2020—2023 年担任某部门经理」——有效时间即 2020 至 2023。可以是时间点或时间区间;查询时可用于「某日/某时刻哪些事实为真」。
事务时间(Transaction Time):描述事实被系统记录的时间。例如该三元组在 2021 年 3 月被写入库,2024 年 1 月被修正——事务时间记录「何时写入、何时更新」。用于审计、回溯「系统在某时刻认为什么是真的」。
双时态(Bitemporal):同时保留有效时间与事务时间,每个事实可表示为 (主体, 关系, 客体, 有效时间起, 有效时间止, 事务时间起, 事务时间止)。支持「历史真相」与「系统认知历史」两类查询:例如「2022 年时该公司认为张三何时是经理」(事务时间 ≤ 2022,再按有效时间);或「当前库中记录的在 2021 年成立的事实」(有效时间覆盖 2021,事务时间取当前)。
Valid time
When the fact holds in the real world; point or interval; query: what was true at time T.
Transaction time
When the system recorded the fact; audit, history of belief; query: what did the system believe at T.
Bitemporal
Both dimensions; (s, r, o, valid_from, valid_to, tx_from, tx_to); historical and audit queries.
二、时序知识图谱与事件图谱
时序 KG(Temporal KG):在三元组上附加时间信息,如 (主体, 关系, 客体, 时间戳) 或 (主体, 关系, 客体, 开始时间, 结束时间)。时间可挂在边上或通过重ified 实体(如「任职」事件)间接表达。查询与推理时可限定「在 T 时刻」或「在 [T1, T2] 内」成立的三元组,用于时序问答、时序链接预测与历史分析。
事件图谱(Event KG):将事件作为一等实体,与参与者、时间、地点等关联。例如「会议」「签约」「任命」等事件节点,通过「参与者」「发生时间」「发生地点」等关系连到实体。事件之间可有因果、顺承、包含等关系,形成事件链或事件图,支撑叙事重建、因果分析与态势感知。
建模上,事件图谱常采用「事件—实体—时间」三角:事件连到多个实体(参与者、客体),并连到时间实体或字面量;时间可细到日、时或区间。与普通 KG 的融合方式可以是:同一图中既有实体与关系,也有事件节点;或事件作为「带时间戳的关系」的另一种表示。
时序与事件
Temporal KG: time on triples; query by time point or interval. Event KG: events as nodes; participants, time, place; event–event relations (causal, follow). Both support historical QA and reasoning.
三、溯源(Provenance):来源、置信度与版本
来源(Source):记录一条知识从何而来——哪份文档、哪个抽取模型、哪次人工标注、哪个外部知识库。可用 URI、数据集 ID、流水线步骤 ID 等表示。溯源支持「为什么系统给出这个答案」的可解释性,以及错误追溯与数据下线(如源文档撤销时批量失效)。
置信度(Confidence):对知识或抽取结果的可信程度量化。可以是模型输出的概率、人工标注的等级、或多源投票/融合后的分数。用于排序、过滤低置信三元组、或与溯源结合做「高置信且可溯源」的展示。置信度可与时间结合:例如某事实在 t 时刻的置信度随新证据更新。
版本(Version):知识的变更历史。包括快照版本(如每日/每周图快照)、或细粒度变更日志(某三元组在某时刻被添加/删除/修改)。版本支持「某日图状态」查询、回滚与审计,与事务时间部分重叠但更偏「发布视图」而非仅数据库事务。
三者结合:一条三元组可关联 (来源, 置信度, 版本)。在存储上可存为属性或单独的表/图;在查询与推理时可按来源过滤、按置信度阈值过滤、或按版本取快照,从而兼顾可解释性、质量与历史管理。
一句话: 时间维度分有效时间(事实在现实世界成立的时间)与事务时间(被系统记录的时间),双时态同时保留二者,支持历史与审计查询。时序 KG在三元组上附加时间戳或区间;事件图谱将事件作为一等实体,与参与者、时间、地点关联,支撑叙事与因果分析。溯源包括来源(谁/哪条数据产生)、置信度(可信度分数)、版本(快照或变更历史),用于可解释、过滤与审计。
四、小结
时序知识图谱与溯源涵盖:时间维度——有效时间与事务时间、双时态模型与查询;时序 KG 与事件图谱——时间戳三元组、事件实体与事件—实体—时间三角;溯源——来源、置信度与版本,支撑可解释、质量与历史管理。下一章讲多模态与跨语言知识图谱:图像与表格等多模态知识的融入、跨语言 KG 与实体对齐、多语言查询与应用。