您好我刚刚下载了一个qazxsw poi文件,指的是来自NCBI的埃及伊蚊的5.8S区域 - 核苷酸。作为一个例子,我在文本中粘贴第一个样本的信息。
从这里我想提取
1. XML
2. <INSDSeq_accession-version>CH477247.1</INSDSeq_accession-version>
3. <INSDSeq_update-date>23-MAR-2015</INSDSeq_update-date>
4. <INSDSeq_create-date>28-OCT-2005</INSDSeq_create-date>
另外,正如我所说,这是所有信息的简短版本我真的下载(13个样本)<INSDReference_journal>Submitted (07-OCT-2005) Broad Institute of MIT and Harvard, 320 Charles Street, Cambridge, MA 02141, USA </INSDReference_journal>
,是否有可能提取所有样本我想要的信息?
我熟悉R但是哪个平台套件更适合这样做?
https://www.ncbi.nlm.nih.gov/nuccore/?term=aedes+aegypti+5.8
`
使用xpath或CSS选择器。
取决于您使用的语言和库。