我想确定 puush.me 图像(链接不是 HTML,只是图像)是 png、jpg 还是 gif。 python 有没有办法做到这一点? Urllib 似乎无法打开图像并检测它们。
要在下载之前从网络服务器本身确定文件的类型,您可以检查
Content-Type
标头。
Python 2.x 示例
import urllib2
my_url = "http://upload.wikimedia.org/wikipedia/en/b/bc/Wiki.png" #example image
request = urllib2.urlopen(my_url)
mime = request.info()['Content-type']
if mime.endswith("png"):
print("Image is a png")
elif mime.endswith("jpeg"):
print("Image is a jpg")
elif mime.endswith("gif"):
print("Image is a gif")
#Image is a png
您可以使用 imghdr 库(包含在 Python 标准库中)来确定图像的类型。
import cStringIO
import imghdr
import urllib2
url = "http://www.gnu.org/graphics/gerwinski-gnu-head.png"
response = urllib2.urlopen(url)
data = cStringIO.StringIO(response.read())
print(imghdr.what(data))
如果你已经获得了文件的数据,你可以检查前几个字节的幻数签名:
例如Python3.x:
with open('image', 'rb') as f:
bytes = f.read()
if bytes.startswith(b'89504E470D0A1A0A'):
print('PNG')
if bytes.startswith(b'FFD8FF'):
print('JPG')
if bytes.startswith(b'424D'):
print('BMP')
if bytes.startswith(b'47494638'):
print('GIF')
import os
def get_extension(image_url):
_, extension = os.path.splitext(image_url)
return extension
image_url = "https://example.com/images/my_image.jpg"
print(get_extension(image_url)) # Output: .jpg