我想在页面https://www.oddsportal.com/soccer/england/premier-league/wolves-newcastle-utd-nNNqedbR/摆脱表信息。
如果我写下面的代码,我得到错误“的HtmlElement”对象有没有属性“find_element_by_xpath”
url = 'https://www.oddsportal.com/soccer/england/premier-league/wolves-newcastle-utd-nNNqedbR/'
options = webdriver.ChromeOptions()
options.add_argument('headless')
driver = webdriver.Chrome(chrome_options=options)
driver.get(url)
html = lxml.html.fromstring(driver.page_source)
tbody = html.find_element_by_xpath('//*[@id="odds-data-table"]/div[1]/table/tbody')
trows = tbody.find_elements_by_tag_name("tr")
LXML是(大概)的lxml库,所以你html
对象是它的一个实例。作为例外,说 - 它没有find_element_by_xpath()
和TAG_NAME方法,这些都是在硒库。
因此,而不是与html
对象的工作,与driver
工作:
tbody = driver.find_element_by_xpath('//*[@id="odds-data-table"]/div[1]/table/tbody')
trows = tbody.find_element_by_tag_name("tr")