监督学习:

根据现有的数据集,知道输入和输出结果,也就是已知特征和标签的对应关系。根据这种已知的关系,训练得到最优的模型。
在监督学习的数据集中,既有特征(feature)信息又有标签(label)信息。通过训练,使得机器找到特征和标签之间的关系(训练得到最优模型)。在新的数据集中,只有特征信息没有标签,让机器根据训练的模型自动去判断出标签

举个栗子:
我们知道适当的水分和充足的光照可以使植物的生长速度更快(但是机器不知道这个常识)。下面是一组记录了每天不同光照时间的植物的生长速度(以下数据属于作者杜撰,看看就好,不要较真)。在这里插入图片描述
在上面的数据集中,水分和光照就是特征,生长就是标签
我们根据已有的数据集,通过训练得到最优的模型。然后根据此模型,可以预测新的数据可能会造成什么结果。比如800ml的水和5个小时的光照(特征),预测一天可能会生长多少毫米(标签)。

无监督学习:

在实际应用中,很多的数据没有办法预先得知样本标签,也就是只有特征。我们需要首先要根据特征对样本数据集进行分类设计,然后对新的数据集进行分类预测。

举个栗子:
我们下载手机app的时候经常会看到推送:下载此应用的用户还下载了xxx。
在这里插入图片描述

平台不会事先得知每个用户想要下载什么app,只会获得此用户的一系列基本信息,比如:年龄、位置、经常访问的页面等等。根据这些特征,去预测人群分类,然后根据人群分类去推送app。

监督学习和无监督学习的常用算法:
在这里插入图片描述

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐