我曾经使用pandas命令:pd.read_csv('path Copy from studio lab')来读取csv文件 但现在这个命令似乎不再起作用了。我在 pandas 命令中使用的路径是通过右键单击上传文件然后选择复制路径获得的。
有什么帮助吗?
错误信息:
FileNotFoundError:[Errno 2]没有这样的文件或目录:'Titanic/train.csv'
您可以使用boto3来读取文件
#pip install boto3
import boto3
s3 = boto3.client('s3')
obj = s3.get_object(
Bucket = 'bucket_name',
Key = 'path/to/file.csv'
)
df = pd.read_csv(obj['Body'], nrows=100)
使用
nrows
检查一些样本,以确保您看到预期的数据。
您可能需要在文件路径前面添加
~/
df = pd.read_csv("~/data/sagemaker_sample.csv")
而不是
df = pd.read_csv("data/sagemaker_sample.csv")