如何将完整列表合并到一个数据框中。当我打印时,它似乎只打印第一条记录,并且还包括\ n和其他冗余(例如'等)。>
import requests from requests_html import HTML, HTMLSession from bs4 import BeautifulSoup import pandas as pd import csv import json url = 'https://lehighsports.com/sports/mens-soccer/schedule/2018' lehigh = requests.get(url).text soup = BeautifulSoup(lehigh,'lxml') for opp in soup.find_all('div',class_="sidearm-schedule-game-opponent-text"): opp_list = [] opp_list.append(opp.text) # print(opp_list) for conf in soup.find_all('div',class_="sidearm-schedule-game-conference-conference"): conf_list = [] conf_list.append(conf.text) # print(conf_list) dict = {'opponent':[opp_list],'conference':[conf_list]} df = pd.DataFrame(dict) print(df)
如何将完整列表合并到一个数据框中。当我打印时,它似乎仅打印第一条记录,并且还包括\ n和其他冗余(例如'etc。来自...
您将每次迭代中的opp_list
和conf_list
设置为[]
-仅初始化一次。 Alson,您不必在创建字典时使用方括号{'opponent':opp_list,'conference':conf_list}
要删除空格,可以对.get_text()
和strip=True
参数使用separator=
方法。