我正在使用Python中的wget库从twitter上下载我通过主题标签过滤的图像。 Twitter使我们能够通过在URL末尾添加大小来选择我们想要查看的图像的大小。
例如:https://pbs.twimg.com/media/DzzjbQ5UYAEh5Y8.jpg:medium
这个URL本身可以浏览,但是当我尝试在它上面使用wget命令时(wget.download(url)
)。我收到一个错误
urllib.error.HTTPError: HTTP Error 404: Not Found
当然,当我删除URL末尾的媒体时,我可以从链接浏览和下载。
任何人都可以告诉我,我们可以做什么来使用wget下载具有大小描述的图像?
这似乎是Python wget中的一个错误 - 我在https://bitbucket.org/techtonik/python-wget/issues/26/urls-with-colon-in-path-404将其作为一个问题提出来了
我建议使用requests
。这是一个更多的代码,但它的工作原理:-)
import requests
image = requests.get("https://pbs.twimg.com/media/DzzjbQ5UYAEh5Y8.jpg:medium")
if 200 == image.status_code:
with open("image.jpg", 'wb') as f:
f.write(image.content)