如何使用python脚本从网站中废弃数据并以层次结构存储在文件夹中?

问题描述 投票:0回答:1

我正在尝试使用python从网站获取数据,然后我在本地下载了文本文件,我想从文本文件中的锚标记中获取数据,并将新文件夹重命名为锚标记值。

这里我使用python创建新文件夹但无法从txt文件和进程中获取数据

我能够创建新文件夹,但我想将重命名作为锚标记值

import os

root_path = '/home'    
folders = ['folder 01', 'folder 02', 'folder 03']    
for folder in folders:
    os.mkdir(os.path.join(root_path, folder))
python html beautifulsoup html-parsing
1个回答
1
投票

请尝试以下代码。它应该创建锚标记中存在的所有文件夹名称。

from bs4 import BeautifulSoup
import requests
import os
url = 'Url Here'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
for folder in soup.find_all('a'):
    root_path = '/home'
    os.mkdir(os.path.join(root_path, folder.text))

如果这项工作,请告诉我。

© www.soinside.com 2019 - 2024. All rights reserved.