指定通过医学叙述应用NLP生成的FHIR资源的来源

Question

是HL7®出版的医疗保健数据交换标准。

提供有关文档的元数据，以便可以发现和管理文档

描述生成和交付或以其他方式影响该资源所涉及的实体和过程

Nearly 80 percent of clinical information in electronic health records(EHRs) is "unstructured" and in a format that health information technology systems cannot use.

因此，应用计算机技术从医疗记录中自动生成结构化数据是很自然的。为此，市场上有几种可用的实现方式，也是完全开源的。例如，cTAKES，CLAMP，NOBLE，ClarityNLP等都是针对此任务的免费解决方案。

它们都解决了从非结构化医学笔记生成结构化数据的特定需求，但是它们都使用自己的格式提供结构，最终可以转换为FHIR。

然而，一个核心问题是如何表示提取信息的来源，因为据我所知，FHIR是缺少连接到DocumentReference对象中提取信息的位置的精确位置的方式，使用哪种技术，哪种是提取信息的“质量”水平。

在向FHIR规范提交变更请求https://gforge.hl7.org/gf/project/fhir/tracker/?action=TrackerItemBrowse之前，建议将问题暴露给最广泛的社区，stackoverflow.com是主要的推荐渠道之一。

为此，我特此期待就此事提出意见，即如何确定通过医学叙述应用NLP而产生的FHIR资源的来源。例如，以Gurulingappa等人的不良事件语料库为例，https://doi.org/10.1016/j.jbi.2012.04.008，

10030778|Intravenous azithromycin-induced ototoxicity.|ototoxicity|43|54|azithromycin|22|34
123456789012345678901234567890123456789012345678901234567890
         1         2         3         4         5

问题是如何向FHIR表示这样的药物诱发问题是从文本中的特定字节位置22-34（药物）和43-54（问题）中提取的（本例中的论文标题为1999）。

{
  "resourceType": "AdverseEvent",
  "id": "example",
  "actuality": "actual",
  "category": [
    {
      "coding": [
        {
          "system": "http://terminology.hl7.org/CodeSystem/adverse-event-category",
          "code": "product-use-error",
          "display": "Product Use Error"
        }
      ]
    }
  ],
  "event": {
    "coding": [
      {
        "system": "http://snomed.info/sct",
        "code": "9062008",
        "display": "Ototoxicity (disorder)"
      }
    ],
    "text": "10030778|Intravenous azithromycin-induced ototoxicity."
  },
  "subject": {
    "reference": "Patient/example"
  },
  "date": "1999-02-29T00:00:00+00:00",
  "seriousness": {
    "coding": [
      {
        "system": "http://terminology.hl7.org/CodeSystem/adverse-event-seriousness",
        "code": "Non-serious",
        "display": "Non-serious"
      }
    ]
  },
  "severity": {
    "coding": [
      {
        "system": "http://terminology.hl7.org/CodeSystem/adverse-event-severity",
        "code": "mild",
        "display": "Mild"
      }
    ]
  },
  "recorder": {
    "reference": "Pharmacotherapy. 1999 Feb;19(2):245-8."
  },
  "suspectEntity": [
    {
      "instance": {
        "reference": "Azithromycin"
      }
    }
  ]
}

目前，FHIR标准不允许表示精确的字节位置，提取的质量以及用于执行它的方法。

Answer 1

很好的讨论。到目前为止，FHIR Provenance的重点是最有可能的Provenance需求。 FHIR的一个重要原则是，在关注不太可能实现或使用的事物之前，我们将重点放在最需要的功能上。这并不是说那些尚未支持的东西不太可能被实现或使用，而是简单地指出要解决的问题的优先级。

因此，在查看您的用例时，我首先要问的是，某些FHIR资源（例如观察）的消费者是否会更深入地关注原产地，而不是观察是从特定文档中提取的重要声明。那就是问一下，如果记录原始细节比现在更深入是否重要？这并不是说在学术上它很有趣，它肯定是合乎逻辑的。但它有多大用处，特别是因为记录这个细节水平会非常昂贵。

让我们假设有一些合理的，虽然很小的需要。 FHIR规范使任何人都可以在任何地方定义扩展。因此，您可以定义支持您的用例的Provenance资源的扩展。可能是Provenance.entity的一些扩展。如果有一些合理的群组需要此扩展，可以使用StructureDefinition在可公开访问的实施指南中定义，并在fhir.org上注册。如果这看起来更有用，可以将这些扩展添加到Provenance资源中的FHIR规范中。

但是，我不相信这是除了那些基于扩展的机制之外的广泛需要的功能。特别是因为只有基于DocumentReference的Binary才需要这种需求，而不是结构化的。

好消息是Provenance只是FMM的3，我们确实希望在下一个R5版本中尝试将其规范化。现在是时候进行这些精彩的讨论了。

指定通过医学叙述应用NLP生成的FHIR资源的来源

问题描述投票：-1回答：1

1个回答

最新问题

指定通过医学叙述应用NLP生成的FHIR资源的来源

问题描述 投票：-1回答：1

1个回答

最新问题

问题描述投票：-1回答：1