我正在使用 python 向服务器发送请求。我从服务器得到一个cookie。我正在尝试解码服务器使用的编码方案 - 我怀疑它是 utf-8 或 base64。 所以我创建了我的标头和连接对象。
resp, content = httpobj.request(server, 'POST', headers=HTTPheader, body=HTTPbody)
然后我从 HTTP 流中提取 cookie
cookie= resp['set-cookie']
我已经尝试过
str.decode()
和unicode()
,但我无法获取cookie的解压内容。
假设 cookie 是
MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2F vvk5ishG%2FsH%2FA%3D%3D
我期望的输出是
20213bea8ff1a309SÉì�t
μs'Ïö¶Ñ¸•с$.kš$5gQIPf®Ì1,8�ºèA�IœöZ€$ùå% *aoªNb²¶ÁöLQÁ8².hÁûœª8<Æ *©úÉz
对于Python 3
unquote
函数位于 parse
子模块
import urllib
import base64
cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""
res = base64.b64decode(urllib.parse.unquote(cookie_val))
print(repr(res))
对于 Python 2,可以直接访问该函数
import urllib
import base64
cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""
res = base64.b64decode(urllib.unquote(cookie_val))
print repr(res)
输出:
"20213bea8ff1a309S\xc9\xec\x98t\x07\xe3\x14pN,\x8b\x9a\x03p~\xe7*\x8e$\x00\x8f\x021\x88\n\xaa~\xb2^\x98-\\\xe4\x86\xb3\xc2}\x82m\xb4n\x04\xa5`\xc5\t\x0b\x9a\xe6\x89\rB\x87\x99\xd4RT\x04@\xd9\xab\xb3.K\x0e\x00.\xba'Pi\x92D\xe7?\x85\xa8\x02O\x9eRZ\x02\xa1\xb6\x16\xfb\xe4\xe6+!\x1b\xfb\x07\xfc"
当然这里的结果是一个8位字符串,所以你必须解码它才能得到你想要的字符串,我不确定使用哪种编码,但是有使用unicode-escape的解码结果( unicode 文字):
>>> print unicode(res, 'unicode-escape')
20213bea8ff1a309SÉìtãpN,p~ç*$1ª~²^-\ä³Â}m´n¥`ÅBÔRT@Ù«³.K.º'PiDç?¨ORZ¡¶ûäæ+!ûü
希望这能有所帮助。