LinearDiscriminantAnalysis参数、属性和方法
阅读原文时间:2023年07月08日阅读:2

【LDA】线性判别分析

参数:

solver:一个字符串,指定了求解最优化问题的算法,可以为如下的值。

  • 'svd':奇异值分解。对于有大规模特征的数据,推荐用这种算法。
  • 'lsqr':最小平方差,可以结合skrinkage参数。
  • 'eigen' :特征分解算法,可以结合shrinkage参数。

skrinkage:字符串‘auto’或者浮点数活者None。该参数通常在训练样本数量小于特征数量的场合下使用。该参数只有在solver=lsqr或者eigen下才有意义

  • '字符串‘auto’:根据Ledoit-Wolf引理来自动决定shrinkage参数的大小。
  • 'None:不使用shrinkage参数。
  • 浮点数(位于0~1之间):指定shrinkage参数。

priors:一个数组,数组中的元素依次指定了每个类别的先验概率。如果为None,则认为每个类的先验概率都是等可能的。

n_components:一个整数。指定了数组降维后的维度(该值必须小于n_classes-1)。

store_covariance:一个布尔值。如果为True,则需要额外计算每个类别的协方差矩阵。

warm_start:一个布尔值。如果为True,那么使用前一次训练结果继续训练,否则从头开始训练。

tol:一个浮点数。它指定了用于SVD算法中评判迭代收敛的阈值。

返回值

coef_:权重向量。

intercept:b值。

covariance_:一个数组,依次给出了每个类别烦人协方差矩阵。

means_:一个数组,依次给出了每个类别的均值向量。

xbar_:给出了整体样本的均值向量。

n_iter_:实际迭代次数。

方法

fix(X,y):训练模型。

predict(X):用模型进行预测,返回预测值。

score(X,y[,sample_weight]):返回(X,y)上的预测准确率(accuracy)。

predict_log_proba(X):返回一个数组,数组的元素一次是 X 预测为各个类别的概率的对数值。 
predict_proba(X):返回一个数组,数组元素一次是 X 预测为各个类别的概率的概率值