[试图用pyqt5解析网站。我的问题是,由该页面创建的选项卡不是链接,而是带有onclick函数的用于创建该选项卡的按钮,因此当我使用linkClicked信号时,什么也不会发生。是我要解析的那个。
我在网上找到的所有示例都会打开带有链接的标签,因此我无法通过它来了解。
P.S。我知道Qwebkit是基于谓词的,但是我必须使用它来与Windows XP兼容。
我有:
from PyQt5 import QtCore, QtGui, QtWidgets
from PyQt5.QtCore import QUrl
from PyQt5.QtWidgets import QApplication, QWidget
from PyQt5.QtWebKitWidgets import QWebView , QWebPage
from PyQt5 import QtWebKit
from PyQt5.QtWebKit import QWebSettings
from PyQt5.QtNetwork import *
import sys
class MainForm(QtWidgets.QMainWindow):
def __init__(self, parent=None):
super(MainForm, self).__init__(parent)
self.tabWidget = QtWidgets.QTabWidget(self)
self.setCentralWidget(self.tabWidget)
self.loadUrl(QtCore.QUrl('https://www.notams.faa.gov/dinsQueryWeb/'))
def loadUrl(self, url):
self.view = QWebView()
self.view.loadFinished.connect(self._on_load_finished)
self.view.linkClicked.connect(self.on_linkClicked)
self.view.loadStarted.connect(self.on_url_changed)
self.view.page().setLinkDelegationPolicy(QWebPage.DelegateAllLinks)
self.tabWidget.setCurrentIndex(self.tabWidget.addTab(self.view, 'loading...'))
self.view.load(url)
def _on_load_finished(self, ok):
index = self.tabWidget.indexOf(self.sender())
self.tabWidget.setTabText(index, self.sender().url().host())
self.view.page().mainFrame().evaluateJavaScript("document.getElementsByTagName('button')[0].click();")
self.view.page().mainFrame().evaluateJavaScript("document.getElementsByName('retrieveLocId')[0].value='%s';"%('lgel lgal lggg'))
self.view.page().mainFrame().evaluateJavaScript("document.getElementsByName('submit')[0].click();")
def on_linkClicked(self, url):
self.loadUrl(url)
def on_url_changed(self):
print('xdddd')
def main():
app = QtWidgets.QApplication(sys.argv)
form = MainForm()
form.show()
app.exec_()
if __name__ == '__main__':
main()
当页面请求创建新窗口时,将调用createWindow(WebWindowType)
;如果该方法未返回新的QWeb [Engine] View(或未实现,则为默认值),则在视图上调用类似的方法;同样,如果未实现,则什么也不会发生。
如果要在与请求相同的新窗口中加载新窗口,只需覆盖WebView并返回createWindow(WebWindowType)
,并启用从javascript打开新窗口的支持:
self
[请注意,如果您像这样执行javascript,它将在新页面加载后立即尝试再次递归调用(并且,由于该新页面中有一个按钮,它将尝试单击它);您应该在第一次加载信号时就断开它的连接。
class SelfishWebView(QWebView):
def createWindow(self, windowType):
return self
class MainForm(QtWidgets.QMainWindow):
# ...
def loadUrl(self, url):
self.view = SelfishWebView()
self.view.page().settings().setAttribute(
QWebSettings.JavascriptCanOpenWindows, True)
# ...