Grep 查找以特定字符结尾的字符串

问题描述 投票:0回答:4

有没有办法使用扩展正则表达式来查找以字符串结尾的特定模式。

我的意思是,我想匹配前 3 行,但不是最后一行:

file_number_one.pdf # comment
file_number_two.pdf # not interesting
testfile_number____three.pdf # some other stuff
myfilezipped.pdf.zip some comments and explanations

我知道在 grep 中,元字符 $ 匹配行尾,但我对匹配行尾而不是字符串尾不感兴趣。 grep 中的组很奇怪,我还不太理解它们。

我尝试使用组匹配,实际上我有一个类似的正则表达式,但它不适用于 grep -E

(\w+).pdf$

有没有办法在 grep/egrep 中进行字符串结尾匹配?

regex bash grep
4个回答
27
投票

您的示例也可以匹配字符串后面的空格:

grep -E '\.pdf ' input.txt

您所说的“字符串”类似于 grep 所说的“单词”。单词是一系列字母数字字符。单词的好处在于,您可以将单词结尾与特殊的

\>
相匹配,它会匹配带有零字符长度行进的单词结尾。这也在行尾匹配。但是单词字符不能改变,并且不包含标点符号,所以我们不能使用它。

如果您也需要在行尾匹配,单词后面没有空格,请使用:

grep -E '\.pdf |\.pdf$' input.txt

包括文件名后面的字符不是空格字符“

”,而是其他空格,例如制表符、
\t
,或者名称后面直接跟有注释(以
#
开头)的情况,用途:

grep -E '\.pdf[[:space:]#]|\.pdf$' input.txt

我也会说明单词边界的匹配,因为这将是完美的解决方案,只是我们不能在这里使用它,因为我们无法更改被视为单词一部分的字符集。

输入包含

foo
作为单独的单词,并且作为较长单词的一部分,其中
foo
不在单词末尾,因此不在单词边界:

$ printf 'foo bar\nfoo.bar\nfoobar\nfoo_bar\nfoo\n'
foo bar
foo.bar
foobar
foo_bar
foo

现在,为了匹配单词的边界,我们可以使用

\<
来匹配开头,使用
\>
来匹配结尾:

$ printf 'foo bar\nfoo.bar\nfoobar\nfoo_bar\nfoo\n' | grep 'foo\>'
foo bar
foo.bar
foo

注意

_
如何匹配为单词字符 - 但除此之外,单词字符只是字母数字,
[a-zA-Z0-9]

另请注意
foo
与行尾的匹配方式 - 在仅包含
foo
的行中。我们不需要特殊情况来表示行尾。


4
投票

您可以使用

\>
运算符

grep 'word\>' fileName

4
投票

您需要转义正则表达式中的

.
。此正则表达式将匹配以 .pdf 结尾的任何内容(并且仅匹配以 .pdf 结尾的内容):

grep '.*\.pdf$' filename

0
投票

正向前瞻最适合这种事情。尝试一下:

grep -P "(^\w+\.pdf)(?=\s)" file

我假设文件名始终位于行的开头。

© www.soinside.com 2019 - 2024. All rights reserved.