json0000 2020-05-15
R 语言中为了进行数据分析,比如回归分析,这时候对于数据表格中的factor类型的数据会带来弊端,比如对因子的每一个数据都进行一次回归,这样就显得很复杂,且违背了我们的初衷,需要把factor转换为numeric格式。
factor不能直接转换为numeric格式,它会按照因子的大小顺序依次取值1,2,3......
想要正确转换为对应的数值,可以先把factor转换为character格式,然后再转换为numeric,就可以正确显示数值
> data<- read.csv(‘breast_cancer.csv‘); > class(data$x6); # 这时候为factor [1] "factor" > # 然后转换factor为numeric > data$x6<-as.numeric(as.character(data$x6)); > class(data$x6); # 这时候为numeric [1] "numeric"
另外需要注意的是,如果你的数据中包含NA值或者其他错误类型的值,那么转换为character类型会产生报错,需要先删去所有错误类型的值,方法详见另一篇博客 https://www.cnblogs.com/zhaoke271828/p/12892718.html
------------------------------
ZKe