在csv中删除urls中的首尾字符有问题。

问题描述 投票:0回答:1

当我使用 requests requests.exceptions.InvalidSchema: No connection adapters were found for'['https:/www.example.comcontactfind..']' . 所以在链接的开头和结尾有两个括号,我是从一个csv文件中读取的。这些大括号之所以会出现在那里,是因为有这样一条语句 links_total.append('https://www.example.com'+cell_link['href']) . 我正试图切开之前的行 requests .是不工作的。我用 row = row[1:-1] 它给出了以下错误 requests.exceptions.InvalidURL: Failed to parse: []. 我想去掉这些括号。

try:
    with open('rt.csv', 'r') as read_obj:
      csv_reader = reader(read_obj)
      for row in csv_reader:
        row = row[1:-1]
        page2 = requests.get(row)

这一行是我用来将这些链接刮到csv文件的程序中的。links_total.append('https://www.example.com'+cell_link['href'])

python-3.x web-scraping
1个回答
0
投票

尝试使用 re 模块,检查 re 模块 文件


0
投票

我刚刚试了一下 row = row[-1] 它的工作。

© www.soinside.com 2019 - 2024. All rights reserved.