我正在学习如何用 python 抓取网站!但我不知道如何做树结构

问题描述 投票:0回答:0

当我按下“https://dicom.innolitics.com/ciods”这个网站上的每个项目时(比如 CR 图像、患者、参考患者序列……这些值),我想将项目的描述保存在变量中的正确布局。 我试图通过单击左侧的项目来保存这些值。 但是,我发现树中的值都没有被爬取!

driver = webdriver.Chrome()

url = "https://dicom.innolitics.com/ciods"
driver.get(url)

wait = WebDriverWait(driver, 10)
wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'tree-table')))

table_list = []

tree_table = driver.find_element(By.CLASS_NAME, 'tree-table')

tree_rows = tree_table.find_elements(By.TAG_NAME, 'tr')
for i, row in enumerate(tree_rows):

    row.click()

    td = row.find_element(By.TAG_NAME, 'td')
    a = td.find_element(By.CLASS_NAME, 'row-name')
    row_name = a.find_element(By.TAG_NAME, 'span').text
    print(f'Row {i+1} name: {row_name}')

driver.quit()

我喜欢这个

想知道如何抓取树中的值。 如果你教我如何爬取右边的布局就更好了:) 谢谢你

python web-scraping web-crawler
© www.soinside.com 2019 - 2024. All rights reserved.