5大算法技术,10个学习包,机器学习的干货收藏了
作者头像
  • 李雪涵
  • 2019-12-24 09:02:51 3

提起人工智能,它早已像空气一样融入了我们的日常生活。无论是庞大的物联网网络还是我们日常使用的Siri,人工智能以各种具体的形式成为生活的一部分。

如果说高等数学是人工智能的基础,那么机器学习则是将知识和技术转化为生产力和产品的关键应用领域。

然而,机器学习是一门多学科交叉的专业,涵盖了概率论、统计学、逼近理论和复杂算法等领域,利用计算机作为工具,致力于实时模拟人类的学习方式,并通过实时结构划分来提高学习效率。

算法决定了机器如何处理大数据。机器学习的算法直接影响学习的结果。要掌握机器学习,最重要的是学会五大主要的算法技术。

五大主要的算法技术

  1. 符号推理 符号推理通常涉及归纳法。归纳法扩展了人类知识的范围,提高了知识水平。归纳法打开了新的探索领域,而归纳法则让人去探索这些领域。但核心理念在于,归纳法是科学部分,而归纳法则属于工程部分。

  2. 神经网络模型 这个流派尝试用硅芯片模拟大脑功能,而非真正的神经元。每个神经元(算法化处理现实世界的对应部分)负责处理问题的一小部分,而多个神经元并行工作可以解决整个问题。这是五大流派中最著名的一个。

  3. 退化算法 这种算法通过树形结构寻找最佳解决方案。每一层的最优解都构建了下一层的功能。核心思想是,下一层更接近问题的解决方案,但可能不能完全解决问题,因此需要新的层次。这一流派大量依赖递归和递归支持的语言。

  4. 贝叶斯推理 贝叶斯推理认为,在没有看到建立假设的证据前,不要轻易相信任何假设。只有通过分析证据才能验证假设。例如,在未检查所有症状前,无法确定一个人患何种疾病。这一流派最著名的成果之一是垃圾邮件过滤器。

  5. 类比学习系统 类比学习系统通过内核机器识别数据中的模式。通过比较一组输入的模式与已知模式,可以创建问题的解决方案。这种方法旨在利用相似性找到最佳解决方案。这一流派最著名的成果之一是推荐系统。

十个必学的机器学习工具

  1. Cloudra Oryx Cloudra Oryx提供基于Apache Kafka和Apache Spark的功能,常用于实时垃圾邮件过滤和推荐引擎。可以从GitHub下载。

  2. CUDA-Convnet CUDA-Convnet库为NVidia的CUDA GPU处理器提供了特定支持,使其在特定情况下运行得更快。主要用于神经网络应用。

  3. ConvNetJS ConvNetJS为JavaScript应用程序提供图像处理支持,特点是异步工作。

  4. E1701 尽管这本书没有直接展示这些用途,但它提供了很多基础知识,如朴素贝叶斯。

  5. GBM GBM(梯度增强机)算法通过梯度下降优化来确定组合学习中合适的学习权重。它带来的性能提升显著,是机器学习中非常强大的预测工具之一。

  6. Gensim Gensim是一个Python库,用于自然语言处理和无监督学习。它提供了多种算法供选择,如TF-IDF、随机投影、潜在狄利克雷分配等。

  7. Glmnet 当有多个特征并且需要减少多重共线性的影响时,正则化是一种有效的处理方案。

  8. RandomForest 随机森林可用于分类和回归任务。Python版本包括RandomForestClassifier和RandomForestRegressor,可在scikit-learn中找到。

  9. Scipy Scipy栈包含了许多其他库,提供了数学、科学和工程方面的支持。其中包括NumPy、SciPy、matplotlib、IPython、Sympy和pandas等。

  10. XGBoost XGBoost软件包使你可以将GBM应用于任何问题,具有广泛的目标函数和评估指标。支持多种编程语言,包括Python、R、Java和C++。

由浅入深讲解机器学习

本书适合Python程序员、R程序员、数据分析人员、机器学习从业者及对算法感兴趣的读者阅读。书中详细介绍了机器学习的基本知识,涵盖了Python和R语言、必备的数学知识、数据处理工具、机器学习应用、常用的机器学习包和模型等内容。

    本文来源:图灵汇
责任编辑: : 李雪涵
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
学习干货算法机器收藏技术
    下一篇