Awk 有内置变量
FNR
和 NR
表示从当前文件读取的记录数(通常是行数)和总数。
在awk中,常见的是:
$ awk 'FNR==NR {first file lines; next } {process remaining lines } f1 f2
通常,
f1
包含确定如何处理剩余文件的值。 (关键词、行号等)
Ruby 具备成为出色的文本处理语言的条件。 Ruby 的
$.
相当于 awk 的 NR
FNR
相当于什么?
鉴于:
$ head f?.txt
==> f1.txt <==
line 1
line 2
==> f2.txt <==
line 3
line 4
Ruby 有 ARGF 流(如果你想感受 Perly,别名为
$<
),它可以读取 STDIN 或从命令行打开文件。与 awk
相同的行为:
$ awk '{
printf("FILENAME: %s, FNR: %s, NR: %s, %s\n", FILENAME, FNR,NR,$0)}
' f?.txt
FILENAME: f1.txt, FNR: 1, NR: 1, line 1
FILENAME: f1.txt, FNR: 2, NR: 2, line 2
FILENAME: f2.txt, FNR: 1, NR: 3, line 3
FILENAME: f2.txt, FNR: 2, NR: 4, line 4
$ ruby -lne '
printf("FILENAME: %s, FNR: %s, NR: %s, %s\n", $<.file.path, $<.file.lineno, $., $_)
' f?.txt
FILENAME: f1.txt, FNR: 1, NR: 1, line 1
FILENAME: f1.txt, FNR: 2, NR: 2, line 2
FILENAME: f2.txt, FNR: 1, NR: 3, line 3
FILENAME: f2.txt, FNR: 2, NR: 4, line 4
如果您想同时读取
STDIN
和文件,您可以使用 -
作为文件占位符:
$ echo '123' | awk '1' - <(echo 456)
123
456
$ echo '123' | awk '1' <(echo 456) -
456
123
$ echo '123' | ruby -lne 'puts $_' - <(echo 456)
123
456
$ echo '123' | ruby -lne 'puts $_' <(echo 456) -
456
123
更多对应的变量:
╔══════════╦═══════════════════╦═════════════════════════════════════════╗
║ awk ║ ruby ║ comment ║
╠══════════╬═══════════════════╬═════════════════════════════════════════╣
║ $0 ║ $_ ║ unsplit record (line usually) ║
║ NF ║ $F.length ║ Number of fields from autosplit ║
║ FNR ║ ARGF.file.lineno ║ Number records read from current source ║
║ NR ║ ARGF.lineno or $. ║ Total number of records so far ║
║ (magic) ║ ARGF or $< ║ stream from either STDIN or a file ║
║ $1..$NF ║ $F[0]..$F[-1] ║ First to last field from autosplit ║
║ FS ║ $; ║ Input field separator ║
║ RS ║ $/ ║ Input record separator ║
║ FILENAME ║ $<.file.path ║ Filename of file being processed ║
╚══════════╩═══════════════════╩═════════════════════════════════════════╝
因此,如果您在
f1
中有一个行号列表,并且想要使用这些行号索引一个文本文件(您可以使用 awk
或 sed
来执行此操作),则可以使用 Ruby。
鉴于:
$ echo "1
2
44
2017" >f1
$ seq 10000 | awk '{print "Line", $1}' >f2
在
awk
你会做:
$ awk 'FNR==NR{ln[$1]; next}
FNR in ln' f1 f2
在 Ruby 中你可以这样做:
$ ruby -lane 'BEGIN{h=Hash.new}
if $<.file.lineno == $<.lineno
h[$F[0].to_i]=true
next
end
puts $_ if h[$<.file.lineno]' f1 f2
两者都打印:
Line 1
Line 2
Line 44
Line 2017
此示例的 awk 版本大约快 5 倍(使用 awk),但 Ruby 版本可以轻松支持 awk 无法支持的输入,例如 JSON、XML、复杂的 csv 等
HERE 是预定义 Ruby 变量的列表。
这里是全局变量列表