我有一个用于netflix数据分析的python项目
下面的代码是一个设置,我将 Netflix 标题用冒号分成三列,然后我从中找出标题是电影还是节目:
df = pd.read_csv("ViewingActivity.csv")
df = df.drop(["属性", "设备类型", "书签", “最新书签”,“国家”,“开始时间”,“持续时间”],轴= 1)
df = df[df["补充视频类型"].isna()]
df[[“电视节目”、“季”、“剧集”]] = df[“标题”].str.split(“:”, expand=True, n=2)
df["Type"] = df["Season"].apply(lambda x: "Movie" if x == None else "Show")
然后我删除无用的列:
df = df.drop(["标题", "补充视频类型", "电视节目", "季", "剧集"], axis=1)
然后我想创建一个名为 Movie 的列以供进一步分析,如果类型是 Movie,我想将值设置为 1,将值设置为 2,则它是 Show
但是当我运行这段代码时:
df["Movie"] = df["Type"].apply(lambda x: "1" if x =="Movie" else "2")
但是当我执行相同的代码但使用配置文件名称而不是类型时它运行正确:
df["电影"] = df["个人资料名称"].apply(lambda x: "1" if x =="Ždáňa" else "2") ()
有人知道我的代码有什么问题吗??