一、模块
1 | sklearn. feature_selection |
二、定义
高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量
使数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。
*应用: *回归分析或者聚类分析当中
原理:找到一条合适直线,通过一个矩阵计算得出主成分分析的结果
三、API
sklearn.decomposition.PCA(n_components=None)
将数据分解为较低维数空间
n_components
- 小数:表示保留百分之多少的信息
- 整数:减少到多少特征
PCA. fit_transfor( X) X :numpy array格式的数据
[n_samples, n_features]
返回值:转换后指定维度的array
四、代码实现
1 | from sklearn.decomposition import PCA |
五、运行结果
1 | data_new: |
评论