特征工程-特征选择介绍
特征工程之特征选择特征选择是特征工程的一部分。特征选择主要解决我们应该使用哪些特征来训练预测模型的问题。选择特征往往需要特定领域知识,但有时候也可以通过某些方法自动选择出和问题相关度大的那些特征。
特征选择与降维特征选择不同于降维,虽然他们都寻求减少数据集中属性的数量,但是降维主要是通过组合多个属性到一个属性来达到降维,而特征选择只是从特征中选择属性却并不改变属性。
降维的方法包括:主成分分析(Principal Component Analysis)、奇异值分解(Singular Value Decomposition)、Sammon映射(Sammon’s Mapping)。这些方法另外讲解。
特征选择的目的在机器学习实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能相
...