码农如何迈入机器学习之门

农如晓
2019-06-22 18:09:41 1

+关注

Python + ?（带你尝甜点）

之前我们讨论过 Python，不知道大家是否还记得。今天再来聊聊。

Python 是一种非常实用的语言，可以应用于多种场景，比如：网站开发、自动化测试、自动化运维、AI 和数据分析等。

虽然 Python 功能强大，但真正关键的还是如何将 Python 与其他领域结合起来。仅仅掌握 Python 本身，只能用来编写一些小工具，无法发挥更大的作用。

AI 为业务赋能的实际（带你吃大餐）

对于金融从业者来说，特别是那些做过金融风控的人，提前识别贷款客户的信用风险和预测还款情况非常重要。这不仅可以降低风险，还能保护平台的利益。

面对这样的业务需求，机器学习能发挥什么作用呢？最近我在探索如何用机器学习解决这类问题，并取得了一些进展。下面我会简单介绍这一过程，希望可以给新手一些启示，填补他们的知识空白。

站在高处看，一览有余

结合近期的实际经验，我简单绘制了一个流程图，主要分为五个步骤来构建信贷逾期风控模型。

数据处理

首先是获取构建信贷风控模型所需的数据，通常保存为 CSV 文件。然后对这些数据进行清洗，去除重复和无意义的字段，最后存储为多个清理后的文件。

数据合并

使用 Python 中的 Pandas 库来合并这些清理后的数据文件，形成一张综合数据表，并进一步去除重复字段。

特征处理

这一步可能比较难，需要根据经验选择合适的特征字段进行模型训练。具体包括处理缺失值和异常值，以及进行数据分箱等操作。

模型训练

将数据按照比例分为训练集和测试集，然后用不同的模型进行训练，最终选出最优模型。

模型评价

通过可视化工具如 Matplotlib 对模型结果进行评估，以便产品和管理层能够快速理解。

用到了哪些技术？

Pandas 是 Python 中常用的数据分析库，主要用于读写 CSV 文件、数据合并和分组操作等。
Scikit-Learn (sklearn) 是一个强大的机器学习库，提供了各种算法的高级封装，适合初学者快速入门。
NumPy 是 Python 中处理数值计算的重要库，提供了高效的多维数组操作。
Matplotlib 是一个绘图库，可以快速生成高质量的图表，使结果更加直观。

如果你对上面的内容不太熟悉，也没有关系，接下来我会带你一起入门机器学习。

鸢尾花，带你入门机器学习

鸢尾花数据集是一个经典的机器学习案例，包含三种类型的鸢尾花：setosa、versicolor 和 virginica。我们将一步步实现一个简单的分类器来识别鸢尾花的种类。

第一步：获取数据

python from sklearn.datasets import load_iris iris_data = load_iris()

第二步：拆分数据集

python from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(iris_data['data'], iris_data['target'], random_state=0)

第三步：构建模型

python from sklearn.neighbors import KNeighborsClassifier knn = KNeighborsClassifier(n_neighbors=1) knn.fit(x_train, y_train)

第四步：模型训练与评价

python y_pred = knn.predict(x_test) print("Test set score: {:.2f}".format(knn.score(x_test, y_test)))

第五步：预测

python new_iris = [[4, 1.0, 2, 1.0]] pred = knn.predict(new_iris) print("Predicted target name: {}".format(iris_data['target_names'][pred]))

结果展示

准确率为：0.97
预测的鸢尾花种类为：['setosa']

通过以上步骤，你已经迈出了机器学习的第一步。实际上，Python 代码并不复杂，主要是应用现成的库，所以大家不必害怕。

写在最后

无论使用哪种编程语言，重要的是思维方式和技术理念。对于技术管理者来说，这种思维方式尤为重要，可以帮助他们更好地做出技术决策。

如果你是 Python 初学者，不必担心。偶尔跳出日常的繁琐工作，接触新的思路和工具，也是非常有益的。

最后，如果你也在从事相关工作，不妨按照本文的思路实践一下，说不定你的领导会对你刮目相看，升职加薪指日可待。

人工智能时代，终身学习是必不可少的。只要不断学习，梦想就会成真。

以上就是改写后的内容，希望能符合你的要求。

图灵汇

责任编辑：：农如晓

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

习之迈入机器如何

中睿天下

2019-06-22