Python beautifulSoup:创建和合并列表并删除\ n]之类的多余内容>

问题描述 投票:0回答:1

如何将完整列表合并到一个数据框中。当我打印时,它似乎只打印第一条记录,并且还包括\ n和其他冗余(例如'等)。>

    import requests
    from requests_html import HTML, HTMLSession
    from bs4 import BeautifulSoup
    import pandas as pd
    import csv
    import json

    url = 'https://lehighsports.com/sports/mens-soccer/schedule/2018'
    lehigh = requests.get(url).text
    soup = BeautifulSoup(lehigh,'lxml')

    for opp in soup.find_all('div',class_="sidearm-schedule-game-opponent-text"):
        opp_list = []
        opp_list.append(opp.text)
     #   print(opp_list)

    for conf in soup.find_all('div',class_="sidearm-schedule-game-conference-conference"):
        conf_list = []
        conf_list.append(conf.text)
    #    print(conf_list)

    dict = {'opponent':[opp_list],'conference':[conf_list]}
    df = pd.DataFrame(dict)
    print(df)

如何将完整列表合并到一个数据框中。当我打印时,它似乎仅打印第一条记录,并且还包括\ n和其他冗余(例如'etc。来自...

python-3.x beautifulsoup python-requests removing-whitespace
1个回答
0
投票

您将每次迭代中的opp_listconf_list设置为[]-仅初始化一次。 Alson,您不必在创建字典时使用方括号{'opponent':opp_list,'conference':conf_list}

要删除空格,可以对.get_text()strip=True参数使用separator=方法。

© www.soinside.com 2019 - 2024. All rights reserved.