机器学习9 主成分分析

卖小孩的咖啡 2020-05-01

一、用自己的话描述出其本身的含义:

1、特征选择:从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。

2、PCA:主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的

由于我们一般不会直接使用原始数据,所以就要进行特征选择;特征选择就是从多个特征中选择部分特征作为训练集的特征,特征在选择前后选择后不改变值

二、并用自己的话阐述出两者的主要区别

特征选择:是单纯地从提取到的所有特征中选择部分特征作为训练集特征,没有改变特征原来的形式

PCA:是从一个维度空间映射到另一个维度空间,改变了特征原来的形式

相关推荐