使用python将某些网站的HTML保存在txt文件中

问题描述 投票:7回答:1

我需要在txt文件中保存任何网站的HTML代码,这是一个非常简单的练习,但我对此有疑问,因为有一个函数可以做到这一点:

import urllib.request

def get_html(url):
    f=open('htmlcode.txt','w')
    page=urllib.request.urlopen(url)
    pagetext=page.read() ## Save the html and later save in the file
    f.write(pagetext)
    f.close()

但这不起作用。

python html parsing python-3.x urllib
1个回答
11
投票

最简单的方法是使用urlretrieve

import urllib

urllib.urlretrieve("http://www.example.com/test.html", "test.txt")

对于Python 3.x,代码如下:

import urllib.request    
urllib.request.urlretrieve("http://www.example.com/test.html", "test.txt")
© www.soinside.com 2019 - 2024. All rights reserved.