如何标准化列中的值

问题描述 投票:0回答:1

让我们使用以下相同的数据集:

年份车型装饰车身变速箱vin状态条件
2015 Tia 索兰托 LX SUV 自动 5xyk ca 5.0
2015 tia 索兰托 LX 轿车自动 7jkg sa 4.0

是否可以标准化“make”列中的值的条目。 ?

我的代码: Count_dic = dict(ct(data_test['make']).items())

“Tia”和“tia”的计数方式不同,但我知道它指的是同一个品牌

我想要一种可以将两者算作一个“make”的情况

注意:它是一个对象Dtype

python data-analysis data-cleaning
1个回答
0
投票

我不确定你所说的标准化到底是什么意思。如果这只是您想要的情况,您可以将整列设置为小写。

我假设您将数据加载为 pandas DataFrame。

df['make'] = df['make'].str.lower()

如果您处理手动输入的数据,其中“Tia”可以采用多种不同的形式,我建议对输入形式进行一些更改。考虑所有可能的改变方式是很困难甚至不可能的。

但是,如果您能够更全面地解释数据的外观和预期输出,以及可能比一行代码多一点的代码,那就太好了。

© www.soinside.com 2019 - 2024. All rights reserved.