我有一个SAS dataset,当我运行它时,我在SAS上得到以下输出:
我还有以下Python代码获取.sas7bdat文件并显示输出,即这里是前五个观察结果。
import pandas as pd
file_name = "cars.sas7bdat"
my_df = pd.read_sas(file_name)
my_df = my_df.head()
print(my_df)
如您所见,当涉及整数数据类型时,它无法正常工作。 CYL和WGT变量是整数但如果我使用pandas的read_sas function则无法正确显示。
知道到底发生了什么事吗?
终于解决了这个问题。嗯,这似乎绝对是熊猫的错误。我通过输入(安装)直接使用.sas7bdat库:
pip install sas7bdat
然后我运行以下代码:
import sas7bdat
from sas7bdat import *
file_name = file_path + "cars.sas7bdat"
foo = SAS7BDAT(file_name)
my_df = foo.to_data_frame()
my_df = my_df.head()
print(my_df)
运行上面的代码后,我在Python中得到以下输出:
因此,我得到了显示正确数据类型的输出。
希望熊猫开发人员找到上述bug的解决方案。