小白入门机器学习必备:编程言语环境引见及搭建
作者头像
  • 无人大飞机
  • 2020-02-13 10:14:08 2

导读

工欲善其事,必先利其器,机器学习亦然。理论再清晰,最终也需要通过编码实现功能和解决问题。

本文将介绍当前机器学习领域流行的编程环境。Python是机器学习应用最广泛的编程语言,在业界口碑极佳,借助机器学习的热潮,迅速成为热门编程语言之一。

本文还会介绍Python环境下机器学习相关的支持库,包括科学计算库NumPy、机器学习库Scikit-Learn和数据处理库Pandas。这些库将显著提高你在实际工作中解决具体问题的效率。

常用环境

算法的实现通常有两种方式:一是亲手编写代码实现所有算法,二是利用工具快速掌握现有资源并着手解决问题。

对于是否需要重复造轮子的讨论,很难得出定论。本文采用第二种方法,目的是解决问题而不是单纯学习知识。

经过多年的发展,机器学习已经积累了丰富的开放资源。充分利用这些资源,即使是初学者也能迅速掌握并解决实际问题。

编程语言:Python

在机器学习领域,Python已经成为无可争议的首选语言。尽管过去Python和R在工业界和学术界各有优势,但随着深度学习的发展,Python因其丰富的支持库而成为首选。

Python不仅适用于机器学习,还因其灵活性和强大的库支持而广泛应用于其他科学领域。因此,选择Python是明智的决定。

支持库:NumPy

机器学习涉及大量的数学运算,尤其是矩阵运算。Python的两大特点是灵活和库多,其中NumPy是专门用于科学计算的支持库,被广泛认可。无论是机器学习还是其他科学领域,NumPy都是不可或缺的工具。

支持库:Scikit-Learn

Python中的机器学习库众多,但Scikit-Learn始终占据领先地位。它功能全面,涵盖了几乎所有常见的机器学习算法,并且封装良好、结构清晰。即使是初学者也能通过简单的代码实现复杂的算法。

支持库:Pandas

Pandas是另一个重要的数据处理库,它内置了许多实用功能,如排序、统计等。虽然没有它也可以工作,但使用Pandas会使处理数据更加便捷。在机器学习实践中,Numpy、Scikit-Learn和Pandas几乎是必备的三件套。

Python简介

Python是一种动态的高级编程语言,无需编译,通过解释器执行。与C和Java相比,Python不需要事先声明数据类型,语法更为灵活。Python代码通常比C和Java简洁得多,且执行效率高。

Python社区流传一句话:“Life is short, I use Python.” 这体现了Python的高效和简洁。

Python不断迭代,分为Python 2.X和Python 3.X两个主要版本。虽然语法差异不大,但代码无法混用。鉴于Python 2.X已不再维护,推荐使用Python 3.X。

安装Python

Python支持多种操作系统,安装简单。可以通过官方网站下载对应版本的安装包。Python是开源的,也可以通过源代码进行编译安装。

Python基本用法

Python是一款通用编程语言,语法简洁。如果你熟悉C或Java,可以认为Python是它们的简化版。除了不用声明类型外,Python还省去了大括号和分号,但缩进是语法层面的要求。

常用工具包括Pip和Conda,前者用于安装第三方库,后者功能更强大。安装第三方库的方法是通过命令行:

bash pip install 库名

bash conda install 库名

NumPy简介

NumPy是Python的科学计算支持库,提供线性代数、傅里叶变换等功能。它是Python科学计算的基础库,广泛应用于图像处理等领域。NumPy官网提供了更多信息。

安装NumPy

安装NumPy非常简单,使用Pip命令即可:

bash pip install -U numpy

NumPy基本用法

NumPy的核心数据结构是Array,与Python的List类似但功能更强。常用功能包括创建、操作、统计等。

导入NumPy并使用别名:

python import numpy as np

常用功能包括创建数组、转置、统计等。

Scikit-Learn简介

Scikit-Learn是Python中广泛使用的机器学习库,提供了丰富的算法和工具。使用Scikit-Learn可以极大地提高工作效率。

安装Scikit-Learn

安装Scikit-Learn有两种方法:

bash pip install -U scikit-learn

bash conda install scikit-learn

Scikit-Learn基本用法

Scikit-Learn库涵盖了常见的机器学习算法,使用简单。例如,线性回归和逻辑回归的用法如下:

```python from sklearn import linearmodel model = linearmodel.LinearRegression()

from sklearn.linear_model import LogisticRegression model = LogisticRegression() ```

使用模型时,通常需要调用fit方法训练模型,然后用predict方法进行预测。

Pandas简介

Pandas是Python中的数据处理库,用于数据清洗和特征工程。数据是模型算法的基础,Pandas可以帮助处理各种格式的数据。

安装Pandas

安装Pandas同样有两种方法:

bash pip install -U pandas

bash conda install pandas

Pandas基本用法

Pandas提供了从不同格式文件中读写数据的功能,常用数据类型包括Series和DataFrame。

导入Pandas并使用别名:

python import pandas as pd

常用功能包括读取、写入、统计等。

通过这些工具,你可以更高效地处理数据,从而更好地应用机器学习算法。

    本文来源:图灵汇
责任编辑: : 无人大飞机
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
小白引见搭建必备入门言语机器编程环境学习
    下一篇