统计Linux文件中排除某些文件的记录

Question

我必须计算6个文件中的记录数，每个文件包含400万条记录（计数应该尽可能快），但是还有另一个具有相似名称的文件应该被省略。

fileSales_1.txt（400 万条记录）

fileSales_2.txt（400 万条记录）

fileSales_3.txt（400 万条记录）

fileSales_4.txt（400 万条记录）

fileSales_5.txt（400 万条记录）

fileSales_6.txt（400 万条记录）

fileSales_unique.txt（2400 万条记录）

我使用以下命令计算日志：

awk 'END {pint NR}' fileSales_*.txt

但是，这样做时，fileSales_unique.txt 存档也很重要，总共提供了 4800 万条记录

你能帮我写一个只计算文件1到6的记录数的指令吗？结果应该是 2400 万条记录， awk 'END {pint NR}' fileSales_(1 to 6).txt

Answer 1

正如评论中提到的，您不需要

awk

来计算记录。您可以使用

wc

：

wc -l fileSales_?.txt

这将接受所有以

fileSales_

开头，然后是一个符号，然后是

.txt

的文件名。如果您想限制数量，可以使用：

wc -l fileSales_[1-6].txt

与

awk

相同：

awk 'END {print NR}' fileSales_?.txt