我必须计算6个文件中的记录数,每个文件包含400万条记录(计数应该尽可能快),但是还有另一个具有相似名称的文件应该被省略。
fileSales_1.txt(400 万条记录)
fileSales_2.txt(400 万条记录)
fileSales_3.txt(400 万条记录)
fileSales_4.txt(400 万条记录)
fileSales_5.txt(400 万条记录)
fileSales_6.txt(400 万条记录)
fileSales_unique.txt(2400 万条记录)
我使用以下命令计算日志:
awk 'END {pint NR}' fileSales_*.txt
但是,这样做时,fileSales_unique.txt 存档也很重要,总共提供了 4800 万条记录
你能帮我写一个只计算文件1到6的记录数的指令吗? 结果应该是 2400 万条记录, awk 'END {pint NR}' fileSales_(1 to 6).txt
正如评论中提到的,您不需要
awk
来计算记录。您可以使用wc
:
wc -l fileSales_?.txt
这将接受所有以
fileSales_
开头,然后是一个符号,然后是 .txt
的文件名。如果您想限制数量,可以使用:
wc -l fileSales_[1-6].txt
与
awk
相同:
awk 'END {print NR}' fileSales_?.txt