我正面临着从页面抓取价值的问题,在我操作的框架中有3个具有相同ID的xpath并且我不能使用更精确的 - 或者不知道如何做到这一点。
我已经尝试在xpath之后添加[0]或[1],但它没有像以下那样解决:
Temp_Pass = WebDriverWait(driver,9000).until(EC.presence_of_element_located((By.XPATH, "//td[@id='content-main-rowOdd']")[0])).text
和
Temp_Pass = WebDriverWait(driver, 9000).until(EC.presence_of_element_located((By.XPATH, "//td[@id='content-main-rowOdd']/following-sibling::tr[1]"))).text
但这两种方法都不起作用
这是来自网站框架的代码:
<tbody>
<tr>
<td id="content-main-rowOdd">For user zxc the fallowing pass has been generated:</td>
</tr>
<tr>
<td id="content-main-rowOdd">
abcd
<div></div>
</td>
</tr>
<tr>
<td id="content-main-rowOdd">
<input id="content-main-button-default" type="submit" onlick="window.close()" name="command-cancel" value="cancel">
<input id="content-main-button-default" type="submit" name="command-next" value="Next">
</td>
</tr>
.....
</tbody>
我想得到的是“abcd”但我只能抓住:“对于用户zxc,已生成以下传递:”
<td>
元素在单独的<tr>
元素中,如果预期元素在第二个<tr>
元素内,那么你可以试试这个:"//table/tr[2]/td[@id='content-main-rowOdd']"
在代码中:
Temp_Pass = WebDriverWait(driver, 30).until(EC.presence_of_element_located((By.XPATH, "//table/tr[2]/td[@id='content-main-rowOdd']"))).text
find_elements_by_
获取所有元素,然后从第二个元素获取文本。
list = WebDriverWait(driver,10).until(EC.presence_of_all_elements_located((By.XPATH,"//td[@id='content-main-rowOdd']")));
Temp_Pass = list[1].text
这是获取第二个元素所需的XPath。你可以在XPath选择器上使用[2]
,但它的使用有点奇怪。
Temp_Pass = WebDriverWait(driver,9000).until(EC.presence_of_element_located((By.XPATH, "(//td[@id='content-main-rowOdd'])[2]"))).text
请注意,XPath包含括号,然后我们选择从该XPath返回的第二项。
你快到了。由于文本abcd与文本关联用户zxc已生成以下传递:,提取文本abcd的简单方法是将文本标识为For user ...然后标识所需节点以诱导WebDriverWait为visibility_of_element_located()
然后提取所需的文本如下:
print(WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.XPATH, "//td[@id='content-main-rowOdd' and contains(., 'generated')]//following::tr[1]/td[@id='content-main-rowOdd']"))).get_attribute("innerHTML"))
注意:您必须添加以下导入:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC