robots.txt curl输出的正则表达式不起作用

问题描述 投票:1回答:1
curl -s http://hostname/robots.txt

解析所需的输出:

User-Agent: *
Disallow: /
User-Agent: Mediapartners-Google*

我需要拿User-Agent: *并检查它以User-agent开头并以*结尾尝试过curl -s "http://hostname" | grep -i "^User\-Agent:\ \*$",但一无所获。

regex linux curl
1个回答
0
投票

解决方案是将输出重定向到另一个文件,并将其转换为UNIX文件。

curl -s http://hostname/robots.txt > /tmp/some_file.txt
dos2unix /tmp/some_file.txt
cat /tmp/some_file.txt | grep -i "^User\-Agent\:\ \*$"
© www.soinside.com 2019 - 2024. All rights reserved.