我们如何在MarkLogic中保留出处和血统?
信封模式的用例是什么?
从数据源导出数据时,是否有任何方法可以跟踪数据沿袭?
您可能对MarkLogic Tracking Data Provenance on-demand tutorial感兴趣
在“数据治理”系列的第1集中,您将探讨数据来源的概念。您将了解跟踪数据的来源或数据的来源对于理解数据及其沿袭至关重要。使用MarkLogic Data Hub Framework和信封模式集成数据孤岛时,您将动手实践并学习如何实现此目标。
该概念已在MarkLogic Data Hub中应用
在MarkLogic中,出处跟踪数据的来源,沿袭是数据的历史。来源元数据是MarkLogic Data Hub跟踪的来源信息和沿袭信息的组合集合。从记录到在MarkLogic Server中的整个生存期,对记录进行的每项更改都会更新源信息。
所有出处和血统信息都作为XML文档(使用PROV XML架构)存储在data-hub-JOBS数据库中,并添加到受保护的集合http://marklogic.com/provenance-services/record中。创建出处和血统记录时,还会生成定义信息之间关系的三元组。
设计模式在此博客中进行了解释
[在构建利用来自不同来源的数据的应用程序时,尤其是在语义上下文中,通常希望捕获源信息,例如源和上次更新时间。
使用Envelope Pattern,用出处详细信息注释三元组的JSON / XML序列化。