我正在抓取 URL 的内容,通过
提取 htmlwkWebView.evaluateJavaScript("document.documentElement.outerHTML.toString()", completionHandler: { (html1: Any?, error: Error?)
然后启动一个 WKWebview,其基本 url 与上面的 URL 源相匹配。如果 baseURL 为 nil,则 Web 视图可以正常显示,但由于 url 为空,链接已失效(about:blank#! 是每个链接的前缀)。添加正确的基本网址会产生几乎正确的链接,但带有“... .com/#!/...”前缀。我可以复制那个不正确的网址,编辑掉“/#!”它有效。
问题:为什么要添加这个?我想我可以在处理每个请求之前覆盖它,拦截链接并更新它,但从未这样做过,但更愿意找出为什么 #!甚至首先被添加。
感谢您的任何提示!
确保您在 HTML 文件中使用正确的字符编码。将以下元标记添加到 HTML 文件的部分以指定字符编码:
<meta charset="UTF-8">