如何使用Selenium Webdriver和Python抓取所有搜索结果

问题描述 投票:0回答:1

我正在尝试从此站点https://brokercheck.finra.org/search/genericsearch/list的搜索结果中抓取所有CRD#

((单击链接时,您需要重做搜索,只需为Individual搜索键入一些随机内容)

enter image description here

我正在使用driver.find_elements_by_xpath定位每个结果页面上的所有CRD编号。但是,我已经尝试了一段时间,但是Webdriver仍然无法从站点获取CRD。

我目前有(在Python中)

crds = driver.find_elements_by_xpath("//md-list-item/div/div/div/div/div/bc-bio-geo-section/div/div/div/div/div/span")

但是结果总是空的。

python selenium xpath css-selectors webdriverwait
1个回答
0
投票

尝试这样使用.find_elements_by_css_selector

crds = driver.find_elements_by_css_selector("span[ng-bind-html='vm.item.id']")

0
投票

要使用CRD#从网站https://brokercheck.finra.org/search/genericsearch/grid中的搜索结果中打印所有Selenium,您必须为visibility_of_all_elements_located()引入WebDriverWait,并且可以使用以下Locator Strategies中的任何一个:] >

  • 使用CSS_SELECTORget_attribute()

    print([my_elem.get_attribute("innerHTML") for my_elem in WebDriverWait(driver, 10).until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR, "span.ng-binding[ng-bind-html='vm.item.id']")))])
    
  • 使用XPATH

  • text
print([my_elem.text for my_elem in WebDriverWait(driver, 10).until(EC.visibility_of_all_elements_located((By.XPATH, "//span[starts-with(., 'CRD')]//following-sibling::span[1]")))])
  • :您必须添加以下导入:
    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support import expected_conditions as EC
    
    © www.soinside.com 2019 - 2024. All rights reserved.