统计学和机器学习到底有什么区别?
作者头像
  • 张娇
  • 2019-10-16 06:31:38 1

统计学和机器学习之间的界限一直较为模糊。无论是在学术界还是工业界,很多人认为机器学习不过是披上了现代外衣的传统统计学。机器学习支持的人工智能也被戏称为“统计学的延伸”。

诺贝尔经济学奖得主托马斯·萨金特曾表示,人工智能本质上就是统计学,只不过用了一些更为华丽的语言来描述。他在一次科技论坛上重申了这一观点,尽管这一论点引发了诸多争议。一些学者从统计学与机器学习的区别出发,提出了不同的看法。例如,哈佛大学博士生Matthew Stewart从统计学与机器学习的不同之处入手,探讨了两者之间的本质区别。

统计学和机器学习的主要区别在于它们的目标。机器学习模型主要关注预测的准确性,而统计模型则侧重于推断变量间的关系。虽然这种说法在技术层面是正确的,但它未能清晰地解释两者的差异。实际上,统计学是对数据的数学研究,而统计模型则是用来推断数据中不同内容的关系或预测未来值的工具。尽管两者密切相关,但它们的目的和应用场景有所不同。

机器学习和统计学在很多情况下都能达到相似的效果,但在某些细节上存在显著差异。例如,线性回归既可以作为一种统计方法,也可以作为机器学习工具。在线性回归中,机器学习侧重于在测试集上获得最佳性能,而统计学则更关注模型参数的清晰度和稳健性。

作为环境科学家,我经常使用这两种方法来分析传感器数据。如果我的目标是证明传感器对特定刺激的响应具有统计显著性,我会采用统计模型来验证这种关系。然而,如果我的目的是预测未来数据,我可能会转向机器学习方法。因为机器学习模型通常更注重预测精度,即使牺牲了模型的解释性。

此外,统计学和机器学习之间存在一些基本的相似性。例如,它们都依赖于概率空间的概念。统计学完全基于概率空间,而机器学习则是基于统计学习理论,该理论同样建立在概率空间的基础上。机器学习中的监督学习方法借鉴了统计学中的实证风险最小化原则,但同时也引入了一些独特的概念,如损失函数和训练集与测试集的划分。

总而言之,统计学和机器学习各有优势,适用于不同的场景。如果你需要构建一个高度精确的预测模型,机器学习可能是更好的选择。但如果你希望探索变量间的复杂关系,统计模型则更为合适。两者相辅相成,共同推动了现代数据分析的发展。

    本文来源:图灵汇
责任编辑: : 张娇
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
统计学区别机器到底学习什么
    下一篇