让我们举个例子,因为我现在正在听音乐。
我想在以下代码中获取href标记中包含的文本。
<a data-testid="nowplaying-track-link" href="/album/3xIwVbGJuAcovYIhzbLO3J">Toosie Slide</a>
我想要获得“ / album / 3xIwVbGJuAcovYIhzbLO3J”,或者如果不可能,请获取“ Toosie Slide”,以便将其存储在变量中以将其与常量进行比较。
Spotify(和许多其他网站)的困难在于,此href标签在网页上多次出现。因此,我只想获取"nowplaying-track-link"
中包含的链接,即data-testid
。
在那里,我希望我很清楚。
PS:我已经知道以下命令:driver.find_element_by_xpath等...但是在这种情况下我无法使用它们...
我不确定您对这种类型的命令的含义并且不能使用它们,但这是您获取所需信息的方式:
element = driver.find_element_by_css_selector('[data-testid="nowplaying-track-link"]')
href = element.get_attribute('href')
element_text = element.text
如果您想把链接放在一起,则可以这样进行:
link = driver.current_url + href