如何导入不带标题和名称的数据集,并在R中使用单独的文件并将名称附加到数据集?

问题描述 投票:-1回答:1

我从https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer/网站下载了数据集和列名称breast-cancer.data-具有没有列标题的数据breast-cancer.names-具有列名称我需要将此数据和列名称加载到R,然后需要附加数据框的列名称。请指导我整个过程。

r data-import
1个回答
0
投票

.data文件只是不带列标题的CSV文件。 .names文件不是标准格式(我可以识别),因此我会手动读取文件并为其指定名称。

dat <- read.csv("~/Downloads/breast-cancer.data", header=FALSE)
names(dat) <- c("class", "age", "menopause", "tumor_size", "inv_nodes", "node_caps", "deg_malig", "breast", "breast_quad", "irradiat")
head(dat)
#                  class   age menopause tumor_size inv_nodes node_caps deg_malig breast breast_quad irradiat
# 1 no-recurrence-events 30-39   premeno      30-34       0-2        no         3   left    left_low       no
# 2 no-recurrence-events 40-49   premeno      20-24       0-2        no         2  right    right_up       no
# 3 no-recurrence-events 40-49   premeno      20-24       0-2        no         2   left    left_low       no
# 4 no-recurrence-events 60-69      ge40      15-19       0-2        no         2  right     left_up       no
# 5 no-recurrence-events 40-49   premeno        0-4       0-2        no         2  right   right_low       no
# 6 no-recurrence-events 60-69      ge40      15-19       0-2        no         2   left    left_low       no
© www.soinside.com 2019 - 2024. All rights reserved.