尝试读取 csv 文件时,我在 pandas 中遇到 URL 错误

问题描述 投票:0回答:2

使用以下代码时出现错误:

将 pandas 导入为 pd 将 matplotlib.pylab 导入为 plt

文件名 =“https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBMDeveloperSkillsNetwork-DA0101EN-SkillsNetwork/labs/Data%20files/auto.csv”

headers = [“符号”,“标准化损失”,“品牌”,“燃料类型”,“愿望”,“门数”,“车身风格”, “驱动轮”,“发动机位置”,“轴距”,“长度”,“宽度”,“高度”,“整备质量”,“发动机类型”, “气缸数”、“发动机尺寸”、“燃油系统”、“缸径”、“冲程”、“压缩比”、“马力”、 “峰值转速”、“城市英里数”、“高速公路英里数”、“价格”]

df = pd.read_csv(文件名,名称=标题)

尝试使用 URL 读取 csv 文件

pandas read.csv
2个回答
0
投票

您需要在文件名字符串前添加原始字符串文字。

您可以执行此操作,但在前面放置一个 r(表示原始字符串)(见下文)。这将使您读取 csv 而不会抛出错误。

filename = r"https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBMDeveloperSkillsNetwork-DA0101EN-SkillsNetwork/labs/Data%20files/auto.csv"

0
投票

如果您在尝试读取 CSV 文件时遇到 pandas 中的 URL 错误,则意味着提供的 URL(统一资源定位器)不正确或无法访问。以下是导致此错误的一些常见原因以及解决该问题的一些步骤:

检查 URL:确保您用于访问 CSV 文件的 URL 正确。仔细检查 URL 中是否有任何拼写错误或缺失字符。

确保互联网连接:确保您有稳定的互联网连接并可以访问其他网站。有时,缺乏互联网连接可能会导致与 URL 相关的错误。

验证文件存在:如果 CSV 文件托管在服务器或网站上,请验证指定 URL 中是否存在该文件。如果文件被移动、重命名或删除,您将遇到错误。

URL 限制:某些网站可能设有限制,以防止使用 pandas 或其他数据读取库直接访问文件。确保您拥有访问该文件所需的权限。

URL 编码:URL 可能包含需要正确编码的特殊字符或空格。如果需要,请使用 urllib 库中的 urllib.parse.quote() 函数对 URL 进行编码。

防火墙或代理问题:如果您在有防火墙或代理的环境中工作,它可能会阻止对某些 URL 的访问。请咨询您的 IT 部门,确保允许必要的 URL。

User-Agent:某些网站可能需要在请求中包含 User-Agent 标头。您可以尝试使用 pandas.read_csv() 函数的 headers 参数将用户代理添加到您的请求中。

以下是如何使用带有自定义 User-Agent 标头的 pandas 从 URL 读取 CSV 文件的示例:

蟒蛇 复制代码 将 pandas 导入为 pd

url = 'https://example.com/data.csv' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, 如 Gecko) Chrome/58.0.3029.110 Safari/537.3'}

尝试: df = pd.read_csv(url, headers=headers) # 对 DataFrame df 做一些事情 除了异常 e: 打印(f“错误:{e}”) 如果您已尝试上述步骤但仍然遇到问题,请仔细检查 URL 并验证是否可以通过网络浏览器访问它。如果您认为问题与网站的设置或配置有关,您可能需要联系网站管理员寻求帮助。

© www.soinside.com 2019 - 2024. All rights reserved.