我正在使用Covid-19数据集(this one),但工作似乎更艰辛,因为每日总数是每天的累积总数,而不是每天的“新病例”。
我一直在尝试根据每个国家/地区的总运行量得出每日新案件的准确数字,但我做得不好-请问有人能够就如何最好地做到这一点提供任何建议吗?
案件的累积频率是截至当前日期的案件总数。从数学上讲,如果前三天的病例数是x,y和z,则累积频率将是:
CF = X + y + z
如果只想计算第一天的计数,则公式为:
x = CF - (y + z)
现在,我们必须在Power BI中实现这一点,考虑到数据集,这有点棘手。数据集中的每个日期都有一列,因此很难获得以前的累积频率。您必须将列取消透视成行,以便每个国家(而不是列)的日期都出现在行上。这是平移的代码片段:
#"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Changed Type1", {"Province/State", "Country/Region", "Lat", "Long"}, "Attribute", "Value")
此后,您只需按日期对数据集进行排序并获得先前的值。