我想将网站上的字段(text)中的值(必须忽略第一行)直接读取到 Python 中的 char 数组中。作为新手,很难弄清楚如何做到这一点 - 似乎有两种方法:通过“导入请求”或通过“导入 urllib.request” - 哪个更好,代码是什么样子?
我发现(通过谷歌搜索)我可以用
读取数据import urllib.request
data = urllib.request.urlopen("https://bwinf.de/fileadmin/user_upload/BwInf/0_2016/35/1._Runde/Materialien/rotation1.txt")
并与
import requests
url = "https://bwinf.de/fileadmin/user_upload/BwInf/0_2016/35/1._Runde/Materialien/rotation1.txt"
data = requests.get(url, allow_redirects=True).content.decode('utf-8')
但是哪一个更好以及如何将数据转换为数组?
requests
和urllib.request
都可以完成工作,但requests
通常更用户友好,并且具有更易读的API。以下是如何读取数据并将其转换为字符数组,跳过第一行。
使用
requests
:
import requests
import numpy as np
url = "https://your_url_here"
response = requests.get(url)
text = response.text.split('\n')[1:] # Skip the first line
char_array = np.array([list(line) for line in text])
使用
urllib.request
:
import urllib.request
import numpy as np
url = "https://your_url_here"
response = urllib.request.urlopen(url)
text = response.read().decode('utf-8').split('\n')[1:] # Skip the first line
char_array = np.array([list(line) for line in text])
选择
requests
以提高可读性和易用性。使用 numpy
轻松将文本转换为字符数组。