1956年提出的AI概念,在短短三年后(1959年),Arthur Samuel提出了机器学习的概念:“研究使计算机能够在无需明确编程的情况下学习的领域。”这一概念的核心在于创建一种特殊的算法,而不是某个特定的算法,使得计算机可以通过数据进行学习并做出预测。因此,机器学习不仅仅指的是某种特定的算法,而是涵盖了很多不同的算法,深度学习就是其中的一部分。
机器学习、人工智能和深度学习之间的关系可以用以下图表表示:
[中心对齐图表]
要更好地应用机器学习,首先需要理解其最基本的思想。这个思想可以分为三个步骤: 1. 将现实生活中的问题抽象成数学模型,并清楚了解模型中各个参数的作用。 2. 使用数学方法解决这个数学模型,从而解决现实中的问题。 3. 评估这个数学模型是否真正解决了问题,以及解决问题的效果如何。
这三个步骤是所有机器学习算法的基础,无论使用何种算法或数据,都无法绕过这三步。
机器学习根据训练方法主要分为三大类:监督学习、非监督学习和强化学习。此外还有一些变种,但本质上仍属于这三类。
监督学习是指我们给算法一个带有正确答案的数据集。机器通过学习数据来掌握正确答案的计算方法。例如,我们可以使用大量猫和狗的照片,并给这些照片打上标签,让机器学会识别猫和狗。这种方法效果显著,但成本较高。
非监督学习中,数据集没有正确的答案,所有数据都是平等的。任务是通过数据集挖掘潜在的结构。例如,给机器一堆未标注的猫和狗的照片,机器可以将照片分为两类,但不知道每类分别是什么。这与监督学习的结果看似相同,但实质不同。
强化学习更接近生物学习的本质,目标是让智能体在环境中采取一系列行为以获得最大累积回报。例如,2019年1月25日,AlphaStar在星际争霸游戏中击败了职业选手,正是利用了强化学习。
机器学习的实际操作可以分为七个步骤: 1. 数据收集:收集各种数据,如不同种类的啤酒和红酒,以及测量颜色和酒精度的工具。 2. 数据准备:整理数据,确保数据质量,并将其分为训练集、验证集和测试集。 3. 选择模型:根据数据特性选择合适的模型。例如,本例中可以选择简单的线性模型。 4. 训练:机器通过数据独立完成训练,类似于解答数学题。 5. 评估:使用验证集和测试集评估模型性能,关注准确率、召回率等指标。 6. 参数调整:通过调整参数优化模型性能。 7. 预测:利用训练好的模型进行预测,如判断一瓶新的酒是啤酒还是红酒。
这些步骤共同构成了机器学习从理论到实践的完整流程。