该网站有可能在登录期间使用java脚本进行回发。我记得很清楚,对于 ASP .Net 站点,您需要获取隐藏表单字段,例如 VIEWSTATE 和 EVENTTARGET 并将它们发布到新 Page 。 您为什么不发送问题网站的链接?之后就变得相对容易弄清楚了
Selenium
和 PhantomJS
from selenium import PhantomJS
import platform
if platform.system() == 'Windows': # .exe for Windows
PhantomJS_path = './phantomjs.exe'
else:
PhantomJS_path = './phantomjs'
service_args = [ # Proxy (optional)
'--proxy=<>',
'--proxy-type=http',
'--ignore-ssl-errors=true',
'--web-security=false'
]
browser = PhantomJS(PhantomJS_path, service_args=service_args)
browser.set_window_size(1280, 720) # Window size for screenshot (optional)
login_url = "<url_here>"
# Credentials
Username = "<insert>"
Password = "<insert>"
# Login
browser.get(login_url)
browser.save_screenshot('login.png')
print browser.current_url
browser.find_element_by_id("<username field id>").send_keys(Username)
browser.find_element_by_id("<password field id>").send_keys(Password)
browser.find_element_by_id("<login button id>").click()
print (browser.current_url)
browser.get(scrape_url)
print browser.page_source
browser.quit()
''' python 和 pycharm 设置路径变量 点维辛检查 包管理器 python 如何安装新版本
用户环境变量 蟒蛇 pyton 中的命令行 '''