列表中的链接 - 如何使用python pdfkit生成几个pdf

Question

我目前正在试图找出如何获取链接列表并使python运行所有这些并将它们保存为pdf。（我不是蟒蛇专家）

我找到了一个名为“pdfkit”的python包，它非常好，但我如何设置它以便它跟随我的url-list并将pdf保存为不同的名字？

import pdfkit

config = pdfkit.configuration(wkhtmltopdf="C:\\Program Files (x86)\\wkhtmltopdf\\bin\\wkhtmltopdf.exe")

pdfkit.from_url('http://google.com', 'MyPDF.pdf', configuration=config)

这是我目前的代码，假设我有一个10个网页的列表，我想保存为10个不同的pdf文件，如何进行设置，允许我这样做？

另一个问题是我需要登录页面才能从链接中获取信息，您将如何实现？

最好的祝福，

Answer 1

回答第一个问题：

import pdfkit

config = pdfkit.configuration(wkhtmltopdf="C:\\Program Files (x86)\\wkhtmltopdf\\bin\\wkhtmltopdf.exe")

url_list = [
    ['http://google.com', 'google.com.pdf'],
    ['http://facebook.com', 'facebook.com.pdf'],
    ['http://yahoo.com', 'yahoo.com.pdf'],
]

for k, v in url_list:
    pdfkit.from_url(k, v, configuration=config)

要回答第二个问题，您可以使用请求模块会话功能首先登录，然后将cookie传递给pdfkit以下载页面。见Create PDF of a https webpage which requires login using pdfkit

Answer 2

import selenium.webdriver
import pdfkit
import time

config = pdfkit.configuration(wkhtmltopdf="C:\\Program Files 
(x86)\\wkhtmltopdf\\bin\\wkhtmltopdf.exe")

driver = selenium.webdriver.Chrome()


driver.get('https://www.linkedin.com/')
time.sleep(1)

driver.find_element_by_id('login-email').send_keys('username')
driver.find_element_by_id('login-password').send_keys('password')
driver.find_element_by_id('login-submit').click()
time.sleep(2)

driver.save_screenshot('output.png') # only visible part

print(driver.page_source)
pdfkit.from_string(driver.page_source, 'file.pdf')

列表中的链接 - 如何使用python pdfkit生成几个pdf

问题描述投票：0回答：2

2个回答

最新问题

列表中的链接 - 如何使用python pdfkit生成几个pdf

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2