我怎样才能获得表的所有项目进行硒(Python3)?

问题描述 投票:0回答:1

我想在页面https://www.oddsportal.com/soccer/england/premier-league/wolves-newcastle-utd-nNNqedbR/摆脱表信息。

这是一个表,它会自动改变她的物品(MB与JS,AJAX)。 enter image description here

如果我写下面的代码,我得到错误“的HtmlElement”对象有没有属性“find_element_by_xpath”

url = 'https://www.oddsportal.com/soccer/england/premier-league/wolves-newcastle-utd-nNNqedbR/'

options = webdriver.ChromeOptions()
options.add_argument('headless')
driver = webdriver.Chrome(chrome_options=options)
driver.get(url)

html = lxml.html.fromstring(driver.page_source)
tbody = html.find_element_by_xpath('//*[@id="odds-data-table"]/div[1]/table/tbody')
trows = tbody.find_elements_by_tag_name("tr")

enter image description here

python selenium parsing python-3.7
1个回答
1
投票

LXML是(大概)的lxml库,所以你html对象是它的一个实例。作为例外,说 - 它没有find_element_by_xpath()和TAG_NAME方法,这些都是在硒库。

因此,而不是与html对象的工作,与driver工作:

tbody = driver.find_element_by_xpath('//*[@id="odds-data-table"]/div[1]/table/tbody')
trows = tbody.find_element_by_tag_name("tr")
© www.soinside.com 2019 - 2024. All rights reserved.