创建数据沿袭

问题描述 投票:0回答:0

在 Apache Atlas 中,我试图对不同进程的数据流进行建模。我遇到的问题是其中一些进程共享公共数据集,但我不一定希望我正在建模的不同进程看起来相互连接。

例如,在这个沿袭模型中,我想表明有一个 XML 数据源文件输入到一个输出并传输到另一台计算机的过程中。

{
  "entity": {
    "typeName": "datasystem_datatransfer",
    "attributes": {
      "id":"b75af137-9279-4c73-be9f-0e37b686dde5",  
       "qualifiedName": "b75af137-9279-4c73-be9f-0e37b686dde5@datasystem_datatransfer",
      "displayName": "Data Transfer Use Case 1",    
       "inputs": [
        {        
          "uniqueAttributes":{"qualifiedName": "25b60fe5-891c-4c94-87ab-b075d838ec30@datasystem_datasource"},  
          "typeName": "datasystem_datasource"
        }
      ],
       "outputs": [
        {        
           "uniqueAttributes":{"qualifiedName": "21781e1b-4b94-435b-be0a-141776267c4e@datasystem_computer"},  
          "typeName": "datasystem_computer"
        }
      ],
      "description": "Data transfer from Data Source to Computer.",
      "name": "dataEgressUseCase1"
    }
  }
}

这将创建一个这样的模型:

datasystem_datasource --> datasystem_datatransfer --> datasystem_computer

我现在有另一个过程我想在我使用相同的“datasystem_computer”的地方建模,但过程有点复杂:

{
  "entities":[
{
    "typeName": "datasystem_datatransfer",
    "attributes": {
      "id":"1305f6c4-f0da-4929-be21-dd0798dc2086",  
       "qualifiedName": "1305f6c4-f0da-4929-be21-dd0798dc2086@datasystem_datatransfer",
      "displayName": "Data Transfer Use Case 2",
        "inputs": [
        {        
          "uniqueAttributes":{"qualifiedName": "c72375fb-34a5-4a22-895c-0d55435fdf26@datasystem_datasource "},  
          "typeName": "datasystem_datasource"
        }
      ],
       "outputs": [
        {        
           "uniqueAttributes":{"qualifiedName": "21781e1b-4b94-435b-be0a-141776267c4e@datasystem_computer"},  
          "typeName": "datasystem_computer"
        }
      ],
      "description": "Data Transfer from Data Source to PC.",
      "name": "dataEgressUseCase2"
    }
  },
  {
    "typeName": "datasystem_datatransfer",
    "attributes": {
      "id":"307e6f84-41af-482e-8641-39fa258e709d",  
        "qualifiedName": "307e6f84-41af-482e-8641-39fa258e709d@datasystem_datatransfer",
      "displayName": "Data Transfer Use Case 2.5",     
       "inputs": [
        {           
          "uniqueAttributes":{"qualifiedName": "21781e1b-4b94-435b-be0a-141776267c4e@datasystem_computer"},  
          "typeName": "datasystem_computer"
        }
      ],
      "outputs": [
        { 
          "uniqueAttributes":{"qualifiedName": "5acddaca-6eb8-48f9-be75-fc757e442985@datasystem_datasource"},  
          "typeName": "datasystem_datasource"
        }
      ],
      "description": "Data Transfer from Data Source to PC to Another PC.",
      "name": "dataEgressUseCase2.5"
    }
  }

  ] 
}

这应该创建一个谱系图,如:

datasystem_datasource --> datasystem_datatransfer --> datasystem_computer --> datasystem_datatransfer datasystem_datasource -->

问题是当我创建这个谱系时,它改变了我创建的第一个谱系。他们有不同的 ID,所以我不确定为什么创建第二个谱系会影响第一个谱系?我意识到它们在一个节点中共享同一个 datasystem_computer,但它们是不同的进程。我做错了什么?

hortonworks-data-platform apache-atlas hortonworks-dataflow governance data-governance
© www.soinside.com 2019 - 2024. All rights reserved.