转换器 - 特征工程的父类#
使用流程
- 实例化(Transformer)
- 调用fit_transform(建立分类词频矩阵)
标准化
1 | #(x-avg)/std |
估计器#
使用流程:
- 实例化(estimator)
estimator.fit(x_train,y_train)
计算,模型生成- 模型评估:
- 直接比对真实值与预测值
y_pred=estimator.predict(x_test); y_test==y_pred
- 计算准确率
accuracy=estimator.score(x_test,y_test)
- 直接比对真实值与预测值
- 用于分类的估计器:
sklearn.neighbors
KNN算法sklearn.naive_bayes
贝叶斯sklearn.linear_model.LogisticRegression
逻辑回归sklearn.tree
决策树与随机森林
- 用于回归的估计器
sklearn.linear_model.LinearRegression
线性回归sklearn.linear_model.Ridge
岭回归
- 用于无监督学习的估计器
sklearn.cluster.KMeans
聚类
- 流程图
1
2
3
4
5
6
7stateDiagram-v2
direction LR
训练集<br>(x_train,y_train) --> fit(x_train,y_train)
fit(x_train,y_train) --> estimator
测试集(x_test,y_test) --> estimator
estimator --> 结果精度<br>score(x_test,y_test)
estimator --> 预测结果<br>y_pred=predict(x_test)