每个人都能理解的机器学习,每个人都能掌握的人工智能。无论你从事何种职业,在这里你都可以学到新知识。
用户向算法提供成对的输入和期望输出,算法会找到一种方法,使给定输入产生期望输出。
监督学习算法是从输入-输出对中学习的机器学习算法。之所以称为“监督”算法,是因为每个用于训练算法的样本都有一个期望输出,就像有一位“导师”在指导算法。尽管创建一个包含输入和期望输出的数据集通常耗时且费力,但监督学习算法易于理解和评估。如果你的应用程序可以被看作是一个监督学习任务,并且你能创建包含期望输出的数据集,那么机器学习很可能能解决你的问题。
例如:识别信用卡交易中的欺诈行为
这里的输入是信用卡交易记录,输出是该交易是否可能是欺诈。假设你是信用卡发行方,收集数据集意味着需要记录所有的交易,并标记出是否有任何交易被报告为欺诈。
在无监督学习中,只有输入数据是已知的,没有为算法提供期望输出。尽管这种算法有许多成功的应用,但理解与评估这些算法往往更加困难。
举例:确定一系列博客文章的主题
如果你有很多文本数据,可以对其进行聚类分析,找到其中的共同主题。事先你可能不知道有多少个主题,也不知道具体是什么主题。因此,输入数据是未知的。
在机器学习中,每个个体或每条记录被称为样本或数据点,而用来描述这些个体的属性称为特征。
数据信息是机器学习的核心,如果没有数据信息,任何机器学习算法都无法做出预测。
举个例子,如果你只有病人的姓氏这一项特征,那么任何算法都无法预测其性别。因为这个信息并没有包含在数据中。如果你增加另一个特征,比如病人的名字,那么预测的准确性会提高,因为通常可以通过名字判断性别。
今天的分享到此结束,如果你感兴趣,欢迎继续关注后续内容。