我正在尝试使用以下代码从网页获取 HTML 源代码:
HttpClient httpClient = new();
httpClient.DefaultRequestHeaders.Add("user-agent", "search app");
var sourceCode = await httpClient.GetStringAsync(url);
我尝试了很多网页,没有任何问题。一切正常,结果是网页的 HTML 内容作为字符串。
但现在我正在尝试使用 Amazon(在 URL 中使用例如“https://www.amazon.com”),结果是加密的。我什至无法复制结果来给你看。
发生了什么事,我该如何解决这个问题?
我非常怀疑它是否已加密。我认为它更有可能被压缩。有关自动解压缩的选项,请参阅 从 HTTPClient 响应解压缩 GZip 流。