我从https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer/网站下载了数据集和列名称breast-cancer.data-具有没有列标题的数据breast-cancer.names-具有列名称我需要将此数据和列名称加载到R,然后需要附加数据框的列名称。请指导我整个过程。
.data
文件只是不带列标题的CSV文件。 .names
文件不是标准格式(我可以识别),因此我会手动读取文件并为其指定名称。
dat <- read.csv("~/Downloads/breast-cancer.data", header=FALSE)
names(dat) <- c("class", "age", "menopause", "tumor_size", "inv_nodes", "node_caps", "deg_malig", "breast", "breast_quad", "irradiat")
head(dat)
# class age menopause tumor_size inv_nodes node_caps deg_malig breast breast_quad irradiat
# 1 no-recurrence-events 30-39 premeno 30-34 0-2 no 3 left left_low no
# 2 no-recurrence-events 40-49 premeno 20-24 0-2 no 2 right right_up no
# 3 no-recurrence-events 40-49 premeno 20-24 0-2 no 2 left left_low no
# 4 no-recurrence-events 60-69 ge40 15-19 0-2 no 2 right left_up no
# 5 no-recurrence-events 40-49 premeno 0-4 0-2 no 2 right right_low no
# 6 no-recurrence-events 60-69 ge40 15-19 0-2 no 2 left left_low no