如何在Linux(csh)中提取特定单词后面的单词?更确切地说,我有一个文件,其中包含一行,如下所示:
[some useless data] --pe_cnt 100 --rd_cnt 1000 [some more data]
我想提取100
之后的数字--pe_cnt
。我不能使用sed,只有当你想要提取整行时才能使用。也许我可以使用awk?
此外,我有多个文件具有不同的值而不是100
所以我需要一些提取值但不依赖于值的东西。
使用awk
:
awk '{for(i=1;i<=NF;i++) if ($i=="--pe_cnt") print $(i+1)}' inputFile
基本上循环遍历该行的每个单词。当您找到第一个要找的时候,抓住下一个单词并打印出来。
使用grep
:
grep -oP "(?<=--pe_cnt )[^ ]+" inputFile
你可以使用sed。只需要组成一组想要匹配并将整个行替换为组:
sed -n 's/^.*pe_cnt\s\+\([0-9]\+\).*$/\1/p' file
如果--pe_cnt
和100
之间存在单空格字符,您可以使用前瞻和后观断言
grep -oP '(?<=--pe_cnt\s)\d+(?=\s+--rd_cnt)'