数据在R中以难看的方式打包

Question

我有一个整齐的问题，根本不会消失，现在真的不知道如何解决。

我有一个小标题，其中第一列ID存储一个整数ID，第二列值类似这样：“ 2.3（09/13）2.6（10/14）2.9（4/15）”所以就去了Numeric（Date）Numeric（Date）Numeric（Date）等等。

问题是，我无法确定此模式将重复多少次。

示例数据：

1 0.2（01/17）0.19（02/17）0.254（03/17）0.26（07/17）0.217（09/17）0.72（11/17）0.896（11/17）

2 0.144（06/17）0.171（08/17）0.21（11/17）

我正在寻找的东西是这样的：1 0.2 01/171 0.19 02/171 0.254 03/17...

我想做的是将其转换为长格式列表。我尝试使用

separate(tibble,
         col = "values",
         into = c("a","b","c","d","e","f","g","h","i","l"),
         sep=c("\\(","\\)")
)

[如果在此之后使用pivot_longer，我可以使它工作，但是问题开始引起我的兴趣，所以现在我试图以更好的方式解决它。

我一直只学习Java之类的东西，所以这种逻辑对我来说是很新的。

谢谢！

...对不起，我不知道如何将数据格式化为表格。

Answer 1

Base R方法，将strsplit结果排列成矩阵。

res <- do.call(rbind.data.frame, Map(function(x, y)
  transform(data.frame(id=y, matrix(el(strsplit(x, "[\\(\\)]")), ncol=2, b=T)),
            X1=as.numeric(levels(X1))[X1]), 
  Map(`[`, strsplit(x, " "), 2), substr(x, 1, 1)))
res
#    id    X1    X2
# 1   1 0.200 01/17
# 2   1 0.190 02/17
# 3   1 0.254 03/17
# 4   1 0.260 07/17
# 5   1 0.217 09/17
# 6   1 0.720 11/17
# 7   1 0.896 11/17
# 8   2 0.144 06/17
# 9   2 0.171 08/17
# 10  2 0.210 11/17

数据

x <- c("1 0.2(01/17)0.19(02/17)0.254(03/17)0.26(07/17)0.217(09/17)0.72(11/17)0.896(11/17)",
       "2 0.144(06/17)0.171(08/17)0.21(11/17)")

Answer 2

代码：

do.call('rbind', unlist(
  apply(df, 1, function(x){
    lapply(strsplit(x, ")", fixed = TRUE), function(y) {
      m <- do.call('rbind', strsplit(y, "[()]"))
      m <- as.data.frame(m, stringsAsFactors = FALSE)
      names(m) <- c('val', 'date')
      m$val <- as.numeric(m$val)
      m
    })
  } ), recursive = FALSE))

#             val  date
# values.1  0.200 01/17
# values.2  0.190 02/17
# values.3  0.254 03/17
# values.4  0.260 07/17
# values.5  0.217 09/17
# values.6  0.720 11/17
# values.7  0.896 11/17
# values.11 0.144 06/17
# values.21 0.171 08/17
# values.31 0.210 11/17

数据：

df <- read.table(text='values
                 1        0.2(01/17)0.19(02/17)0.254(03/17)0.26(07/17)0.217(09/17)0.72(11/17)0.896(11/17)

                 2        0.144(06/17)0.171(08/17)0.21(11/17)', stringsAsFactors = FALSE, header = TRUE)

数据在R中以难看的方式打包

问题描述投票：0回答：2

2个回答

最新问题

数据在R中以难看的方式打包

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2