我想在 Python 中规范化 URL。我的主要目的是在 URL 末尾添加斜杠 /(如果尚不存在),但前提是 URL 尚未以斜杠或文件扩展名结尾(因此图像、.php、文件页面等不以斜杠结尾)不受影响)。
例如,如果是
http://www.example.com
,则应将其转换为http://www.example.com/
。但如果是http://www.example.com/image.png
那么应该不会受到影响。
为此,我使用正则表达式
/([^/.]+)$
。 正则表达式演示
但是在这个python代码中不起作用,
start_url
没有修改
import re
start_url = "https://zonetuto.fr"
start_url = re.sub(r'/([^/.]+)$', r'/\1/', start_url)
print(start_url)
你可以这样做
url = "https://example.com"
if url.count("/") == 2:
url = url + "/"
print(url)