Pandas系列唯一方法显示的值看起来相同

问题描述 投票:0回答:2

我有一个熊猫数据框。当我对其中一列运行.unique()方法时,它显示的值看起来相同。如何查看这些值的差异?我尝试从unique()方法索引,但是值只是字符串,如下所示。感谢您的帮助。

df["MyColumn"].unique()
array(['yi̇', 'yd', 'yi'], dtype=object)
_______________________________________
df["MyColumn"].unique()[0]
'yi̇'
_______________________________________
df["MyColumn"].unique()[2]
'yi̇'

python pandas series
2个回答
1
投票

仔细检查,您会发现区别:

'yi̇' # the i letter has two dots
'yi' # normal i letter

所以您似乎看了两个不同的unicode字符,但是看起来非常相似。


1
投票

您可以检查asci代码有什么区别,这里i不同:

u = ['yi̇', 'yd', 'yi']
print ([list(map(ord,i)) for i in u])
[[121, 105, 775], [121, 100], [121, 105]]
© www.soinside.com 2019 - 2024. All rights reserved.