指定通过医学叙述应用NLP生成的FHIR资源的来源

问题描述 投票:-1回答:1

FHIR

是HL7®出版的医疗保健数据交换标准。

DocumentReference

提供有关文档的元数据,以便可以发现和管理文档

通过Provenance可以

描述生成和交付或以其他方式影响该资源所涉及的实体和过程

Nearly 80 percent of clinical information in electronic health records(EHRs) is "unstructured" and in a format that health information technology systems cannot use.

因此,应用计算机技术从医疗记录中自动生成结构化数据是很自然的。为此,市场上有几种可用的实现方式,也是完全开源的。例如,cTAKES,CLAMP,NOBLE,ClarityNLP等都是针对此任务的免费解决方案。

它们都解决了从非结构化医学笔记生成结构化数据的特定需求,但是它们都使用自己的格式提供结构,最终可以转换为FHIR。

然而,一个核心问题是如何表示提取信息的来源,因为据我所知,FHIR是缺少连接到DocumentReference对象中提取信息的位置的精确位置的方式,使用哪种技术,哪种是提取信息的“质量”水平。

在向FHIR规范提交变更请求https://gforge.hl7.org/gf/project/fhir/tracker/?action=TrackerItemBrowse之前,建议将问题暴露给最广泛的社区,stackoverflow.com是主要的推荐渠道之一。

为此,我特此期待就此事提出意见,即如何确定通过医学叙述应用NLP而产生的FHIR资源的来源。例如,以Gurulingappa等人的不良事件语料库为例,https://doi.org/10.1016/j.jbi.2012.04.008

10030778|Intravenous azithromycin-induced ototoxicity.|ototoxicity|43|54|azithromycin|22|34
123456789012345678901234567890123456789012345678901234567890
         1         2         3         4         5

问题是如何向FHIR表示这样的药物诱发问题是从文本中的特定字节位置22-34(药物)和43-54(问题)中提取的(本例中的论文标题为1999)。

{
  "resourceType": "AdverseEvent",
  "id": "example",
  "actuality": "actual",
  "category": [
    {
      "coding": [
        {
          "system": "http://terminology.hl7.org/CodeSystem/adverse-event-category",
          "code": "product-use-error",
          "display": "Product Use Error"
        }
      ]
    }
  ],
  "event": {
    "coding": [
      {
        "system": "http://snomed.info/sct",
        "code": "9062008",
        "display": "Ototoxicity (disorder)"
      }
    ],
    "text": "10030778|Intravenous azithromycin-induced ototoxicity."
  },
  "subject": {
    "reference": "Patient/example"
  },
  "date": "1999-02-29T00:00:00+00:00",
  "seriousness": {
    "coding": [
      {
        "system": "http://terminology.hl7.org/CodeSystem/adverse-event-seriousness",
        "code": "Non-serious",
        "display": "Non-serious"
      }
    ]
  },
  "severity": {
    "coding": [
      {
        "system": "http://terminology.hl7.org/CodeSystem/adverse-event-severity",
        "code": "mild",
        "display": "Mild"
      }
    ]
  },
  "recorder": {
    "reference": "Pharmacotherapy. 1999 Feb;19(2):245-8."
  },
  "suspectEntity": [
    {
      "instance": {
        "reference": "Azithromycin"
      }
    }
  ]
}

目前,FHIR标准不允许表示精确的字节位置,提取的质量以及用于执行它的方法。

nlp text-mining hl7-fhir information-extraction
1个回答
-1
投票

很好的讨论。到目前为止,FHIR Provenance的重点是最有可能的Provenance需求。 FHIR的一个重要原则是,在关注不太可能实现或使用的事物之前,我们将重点放在最需要的功能上。这并不是说那些尚未支持的东西不太可能被实现或使用,而是简单地指出要解决的问题的优先级。

因此,在查看您的用例时,我首先要问的是,某些FHIR资源(例如观察)的消费者是否会更深入地关注原产地,而不是观察是从特定文档中提取的重要声明。那就是问一下,如果记录原始细节比现在更深入是否重要?这并不是说在学术上它很有趣,它肯定是合乎逻辑的。但它有多大用处,特别是因为记录这个细节水平会非常昂贵。

让我们假设有一些合理的,虽然很小的需要。 FHIR规范使任何人都可以在任何地方定义扩展。因此,您可以定义支持您的用例的Provenance资源的扩展。可能是Provenance.entity的一些扩展。如果有一些合理的群组需要此扩展,可以使用StructureDefinition在可公开访问的实施指南中定义,并在fhir.org上注册。如果这看起来更有用,可以将这些扩展添加到Provenance资源中的FHIR规范中。

但是,我不相信这是除了那些基于扩展的机制之外的广泛需要的功能。特别是因为只有基于DocumentReference的Binary才需要这种需求,而不是结构化的。

好消息是Provenance只是FMM的3,我们确实希望在下一个R5版本中尝试将其规范化。现在是时候进行这些精彩的讨论了。

© www.soinside.com 2019 - 2024. All rights reserved.