如何从XML文件中选择特定信息?在R或其他平台

问题描述 投票:0回答:1

您好我刚刚下载了一个qazxsw poi文件,指的是来自NCBI的埃及伊蚊的5.8S区域 - 核苷酸。作为一个例子,我在文本中粘贴第一个样本的信息。

从这里我想提取 1. XML 2. <INSDSeq_accession-version>CH477247.1</INSDSeq_accession-version> 3. <INSDSeq_update-date>23-MAR-2015</INSDSeq_update-date> 4. <INSDSeq_create-date>28-OCT-2005</INSDSeq_create-date>

另外,正如我所说,这是所有信息的简短版本我真的下载(13个样本)<INSDReference_journal>Submitted (07-OCT-2005) Broad Institute of MIT and Harvard, 320 Charles Street, Cambridge, MA 02141, USA </INSDReference_journal>,是否有可能提取所有样本我想要的信息? 我熟悉R但是哪个平台套件更适合这样做?

https://www.ncbi.nlm.nih.gov/nuccore/?term=aedes+aegypti+5.8

`

r xml
1个回答
0
投票

使用xpath或CSS选择器。

取决于您使用的语言和库。

© www.soinside.com 2019 - 2024. All rights reserved.