需要在Raku / perl6中每第n行读取文本文件的建议

问题描述 投票:2回答:1

有人可以给我一些建议,让我了解如何在Raku / perl6中按第n个文件读取文本文件吗?

在生物信息学研究中,有时我们需要以比直接方式少的方式来解析文本文件。例如Fastq文件,一次以4行为一组存储数据。甚至更多,这些Fastq文件成对出现。因此,如果我们需要解析此类文件,则可能需要执行以下操作:从第一个Fastq文件读取4行,从第二个Fastq文件读取4行,然后从第一个Fastq文件读取接下来的4行,然后读取第二个fastq文件中的下4行,...

关于解决此问题的最佳方法是什么,我有什么建议? Raku的“ IO.lines”方法似乎能够一次处理每一行。但不确定如何处理每第n行

fastq文件对示例:https://github.com/wtwt5237/perl6-for-bioinformatics/tree/master/Come%20on%2C%20sister/fastq我们之前使用“ IO.lines”尝试过的操作:https://github.com/wtwt5237/perl6-for-bioinformatics/blob/master/Come%20on%2C%20sister/script/benchmark2.p6

谢谢!

Tao

perl6 raku
1个回答
0
投票

您可以使用lines方法。 Raku Sequence很懒。这意味着对"somefile".IO.lines之类的表达式进行迭代只会将一行读入内存,而不会读取整个文件。为了进行后者,您需要将Sequence分配给Array

pairs方法可帮助您获取行的索引。结合除以运算符%%,我们可以编写

"somefile".IO.lines.pairs.grep({ .key && .key %% 4 }).map({ .value })

为了获得文件中第4行的序列。

© www.soinside.com 2019 - 2024. All rights reserved.