机器学习之以sklearn的svc为例展现算法过程

通常的算法模型训练流程如下：

首先，需要获取并导入所需的数据。在这个例子中，我们将使用sklearn自带的鸢尾花数据集，因此只需简单导入即可完成这一步骤。

接下来是对数据进行预处理。通过对数据集的观察发现，各特征之间的数值差异较大，这可能会影响训练结果的准确性。因此，我们需要对数据进行处理，使其数值范围缩小。具体操作是采用MinMaxScaler进行缩放，最终所有数据都会被归一化到0到1之间。

在进行模型训练之前，必须将数据集分割成训练集和测试集。这样做是为了避免将所有数据一次性输入模型进行训练，因为这样会导致无法评估模型的性能。一般情况下，我们会将大部分数据（例如三分之二）作为训练集，其余部分（如三分之一）则作为测试集，以验证训练好的模型的准确度。

随后，我们需要从sklearn库中选择合适的模型，并利用训练集数据对其进行训练。这一步骤对于整个模型构建过程至关重要。

完成模型训练后，下一步是对模型进行评估。此时，测试集的作用便显现出来，它可以帮助我们判断模型在未知数据上的表现如何。

最后，为了方便后续使用，我们需要将训练好的模型保存起来。这样，每次需要进行预测时，都可以直接加载已训练好的模型，而无需重复训练过程。

责任编辑：：施米德智能门窗

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2020-07-19

机器学习必读TOP100论文清单：高援用、覆盖面广丨GitHub 21.4k星