我的文件看起来像这样
abc ||| xyz ||| foo bar
hello world ||| spam ham jam ||| blah blah
我想提取特定的列,例如我本可以这样做:
sed 's/\s|||\s/\\t/g' file | cut -f1
但是还有其他方法吗?
由于
|
是有效的正则表达式,因此需要使用 \\|
进行转义或放入方括号中:[|]
。
你可以这样做:
awk -F' \\|\\|\\| ' '{print $1}' file
其他一些也有效的变体:
awk -F' [|][|][|] ' '{print "$1"}' file
awk -F' [|]{3} ' '{print "$1"}' file
awk -F' \\|{3} ' '{print "$1"}' file
awk -F' \\|+ ' '{print "$1"}' file
awk -F' [|]+ ' '{print "$1"}' file
作为分隔符在方括号中效果不佳,只能转义,并且有很多转义字符:)\
cat file
abc \\\ xyz \\\ foo bar
示例:表达式中的每个
\
对应 4 个 \
,因此总共 12 个 \
。
awk -F' \\\\\\\\\\\\ ' '{print $2}' file
xyz
或
awk -F' \\\\{3} ' '{print $2}' file
xyz
或者这个,但也没简单多少
awk -F' [\\\\]{3} ' '{print $2}' file
xyz
awk -F' [\\\\][\\\\][\\\\] ' '{print $2}' file
xyz
您可以使用 awk 来完成 -
$ awk 'BEGIN {FS=" \|\|\| ";}{print $1}' file
用 $2、$3 等替换 $1。