sklearn-转换器与预估器

转换器 - 特征工程的父类#

使用流程

  • 实例化(Transformer)
  • 调用fit_transform(建立分类词频矩阵)

标准化

1
2
3
4
#(x-avg)/std
fit_transform()
fit() #计算平均值与标准差
tranform() #利用(x-avg)/std进行最终转换

估计器#

使用流程:

  • 实例化(estimator)
  • estimator.fit(x_train,y_train) 计算,模型生成
  • 模型评估:
    • 直接比对真实值与预测值 y_pred=estimator.predict(x_test); y_test==y_pred
    • 计算准确率 accuracy=estimator.score(x_test,y_test)
  1. 用于分类的估计器:
    • sklearn.neighbors KNN算法
    • sklearn.naive_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  2. 用于回归的估计器
    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  3. 用于无监督学习的估计器
    • sklearn.cluster.KMeans 聚类
  • 流程图
    1
    2
    3
    4
    5
    6
    7
    stateDiagram-v2
        direction LR
        训练集<br>(x_train,y_train) --> fit(x_train,y_train)
        fit(x_train,y_train) --> estimator
        测试集(x_test,y_test) --> estimator
        estimator --> 结果精度<br>score(x_test,y_test)
        estimator --> 预测结果<br>y_pred=predict(x_test)