转换源数据的最佳方法?

问题描述 投票:0回答:1

在R中工作,但我认为这个问题是通用的。

华尔街日报 将美国疾病感染率的数据集可视化。enter image description here

X轴是年份 Y轴是州。

而每块瓦片的红色阴影是该年记录的该特定州的感染率强度。

被可视化的源数据集排列如下。enter image description here

数据集中的每一行都对应着一个国家在某一年的单一感染率。因此,可视化中的每一个红色瓷砖对应于数据集中的一行。

但如果数据集是这样的呢?enter image description here

现在,每一行对应一个国家。而每一行都有多个感染率,每记录一年就有一个。这可能与现实世界中的数据捕获方式相匹配,因为对于每一年或每一天(在冠状病毒的情况下),你跟踪感染率,你可以只添加一个新的列(而不是50个新行)。

问题是虽然这种布局对人类比较友好,但对R不是很友好。我们可以很容易地根据源数据集的排列方式创建瓦片可视化,其中数据是按感染率排列的,但如果是按状态排列,就不那么容易了。

所以,最后,我的问题是--在Excel中,有没有一种简单的方法可以将数据从第二种布局转化为第一种布局?

r import import-from-excel import-from-csv
1个回答
0
投票

你可以使用免费的、开源的转置功能。OpenRefine 工具,以便在将数据文件加载到R中之前进行准备。

© www.soinside.com 2019 - 2024. All rights reserved.