“>
大家好,所以我在解决上述问题时遇到了麻烦。如图所示,我有几个属性,这些属性在这些单个单元格中具有逗号分隔的值。这里的主要问题是试图将它们分割开,并保留实体的正确信息。
当前,单行表示单个实体。我尝试使用熊猫将它们拆分,具体是通过split and explode函数,如下所示。
df.set_index(['Name', 'Entity Type', ... 'News', 'University',
'Done Editing!']).apply(lambda x: x.str.split(',').explode()).reset_index()
我已经注意到要排除要拆分的列,并保留不需要的列。但是,此方法不适用于多列,因为我得到了ValueError: cannot handle a non-unique multi-index!
。
这里的目标是能够分割所有这些记录,以便我最终可以在BI工具(如Tableau)中使用它们来创建仪表板。将不胜感激任何建议或我可以如何做到这一点。
大家好,所以我在解决上述问题时遇到了麻烦。如图所示,我有几个属性,这些属性在这些单个单元格中具有逗号分隔的值。主要问题...
我刚刚完成了一篇博客文章,其中嵌入了python脚本供下载,这是通过Tableau Prep中的TabPy服务器完成的。签出:https://apogeeintegration.com/blog/apogee-busts-out-multi-value-cells-using-tableau-prep-builder