解码从 HTTP 流中提取的 Cookie 变量 - Python

问题描述 投票:0回答:1

我正在使用 python 向服务器发送请求。我从服务器得到一个cookie。我正在尝试解码服务器使用的编码方案 - 我怀疑它是 utf-8 或 base64。 所以我创建了我的标头和连接对象。

resp, content = httpobj.request(server, 'POST', headers=HTTPheader, body=HTTPbody)

然后我从 HTTP 流中提取 cookie

cookie= resp['set-cookie']

我已经尝试过

str.decode()
unicode()
,但我无法获取cookie的解压内容。

假设 cookie 是

MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2F vvk5ishG%2FsH%2FA%3D%3D

我期望的输出是

20213bea8ff1a309SÉì�t

LQÁ8².hÁûœª8<Æ
  *©úÉz
μs'Ïö¶Ñ¸•с$.kš$5gQIPf®Ì1,8�ºèA�IœöZ€$ùå% *aoªNb²¶Áö

python http cookies utf-8 base64
1个回答
3
投票

对于Python 3

unquote
函数位于
parse
子模块

import urllib
import base64

cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""

res =  base64.b64decode(urllib.parse.unquote(cookie_val))

print(repr(res))

对于 Python 2,可以直接访问该函数

import urllib
import base64

cookie_val = """MjAyMTNiZWE4ZmYxYTMwOVPJ7Jh0B%2BMUcE4si5oDcH7nKo4kAI8CMYgKqn6yXpgtXOSGs8J9gm20bgSlYMUJC5rmiQ1Ch5nUUlQEQNmrsy5LDgAuuidQaZJE5z%2BFqAJPnlJaAqG2Fvvk5ishG%2FsH%2FA%3D%3D"""

res =  base64.b64decode(urllib.unquote(cookie_val))

print repr(res)

输出:

"20213bea8ff1a309S\xc9\xec\x98t\x07\xe3\x14pN,\x8b\x9a\x03p~\xe7*\x8e$\x00\x8f\x021\x88\n\xaa~\xb2^\x98-\\\xe4\x86\xb3\xc2}\x82m\xb4n\x04\xa5`\xc5\t\x0b\x9a\xe6\x89\rB\x87\x99\xd4RT\x04@\xd9\xab\xb3.K\x0e\x00.\xba'Pi\x92D\xe7?\x85\xa8\x02O\x9eRZ\x02\xa1\xb6\x16\xfb\xe4\xe6+!\x1b\xfb\x07\xfc"

当然这里的结果是一个8位字符串,所以你必须解码它才能得到你想要的字符串,我不确定使用哪种编码,但是有使用unicode-escape的解码结果( unicode 文字):

>>> print unicode(res, 'unicode-escape') 
20213bea8ff1a309SÉìtãpN,p~ç*$1ª~²^-\ä³Â}m´n¥`ÅBÔRT@Ù«³.K.º'PiDç?¨ORZ¡¶ûäæ+!ûü

希望这能有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.