在单个单元格内用逗号分隔多个单元格的数据

问题描述 投票:1回答:1

“单行中属性的示例”“>

大家好,所以我在解决上述问题时遇到了麻烦。如图所示,我有几个属性,这些属性在这些单个单元格中具有逗号分隔的值。这里的主要问题是试图将它们分割开,并保留实体的正确信息。

当前,单行表示单个实体。我尝试使用熊猫将它们拆分,具体是通过split and explode函数,如下所示。

df.set_index(['Name', 'Entity Type', ... 'News', 'University', 'Done Editing!']).apply(lambda x: x.str.split(',').explode()).reset_index()

我已经注意到要排除要拆分的列,并保留不需要的列。但是,此方法不适用于多列,因为我得到了ValueError: cannot handle a non-unique multi-index!

这里的目标是能够分割所有这些记录,以便我最终可以在BI工具(如Tableau)中使用它们来创建仪表板。将不胜感激任何建议或我可以如何做到这一点。

大家好,所以我在解决上述问题时遇到了麻烦。如图所示,我有几个属性,这些属性在这些单个单元格中具有逗号分隔的值。主要问题...

database pandas tableau
1个回答
0
投票

我刚刚完成了一篇博客文章,其中嵌入了python脚本供下载,这是通过Tableau Prep中的TabPy服务器完成的。签出:https://apogeeintegration.com/blog/apogee-busts-out-multi-value-cells-using-tableau-prep-builder

© www.soinside.com 2019 - 2024. All rights reserved.