轻松读懂机器学习的三大类别

字数 1554阅读 1564评论 0赞 4

深度学习三大牛之一的Yann Lecun教授给出了一个关于机器学习中的监督学习、无监督学习和增强学习的一个有趣的比喻，他说：如果把智能（Intelligence）比作一个蛋糕，那么无监督学习就是蛋糕本体，增强学习是蛋糕上的樱桃，那么监督学习，仅仅能算作蛋糕上的糖霜。

那么机器学习的这三大类别究竟指的是什么呢？它们之间有什么区别呢？通过三个简明的例子来看一下。

监督学习（supervised learning）

监督学习是指通过已有的训练样本（即已知数据以及其对应的输出）来训练，从而得到一个最优模型，再利用这个模型将所有新的数据样本映射为相应的输出结果，对输出结果进行简单的判断从而实现分类的目的，那么这个最优模型也就具有了对未知数据进行分类的能力。

监督学习中只要输入样本集,机器就可以从中推演出制定目标变量的可能结果。如协同过滤推荐算法,通过对训练集进行监督学习,并对测试集进行预测,从而达到预测的目的。

举个例子

假设你是一名房产经纪，生意越做越大，因此你雇了一批实习生来帮你。但是问题来了，你可以看一眼房子就知道它到底值多少钱，实习生没有经验，不知道如何估价。

为了帮助你的实习生，你决定写个小软件，可以根据房屋大小、地段以及类似房屋的成交价等因素来评估你所在地区房屋的价值。

你把3个月来城里每笔房屋交易都写了下来，每一单你都记录了一长串的细节——卧室数量、房屋大小、地段等等。但最重要的是，你写下了最终的成交价：

微信图片_20170929093921.jpg

这是我们的“训练数据”

我们要利用这些训练数据来编写一个程序来估算该地区其他房屋的价值：

微信图片_20170929093940.jpg

这就称为监督式学习。你已经知道每一栋房屋的售价，换句话说，你知道问题的答案，并可以反向找出解题的逻辑。

无监督学习（unsupervised learning）

与监督学习相对应的是无监督学习,此时数据没有类别信息,也不会给定目标值。在无监督学习中 , 将数据集合分成由类似的对象组成的多个类的过程被称为聚类;将寻找描述数据统计值的过程称之为密度估计。此外,无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息。

举个例子

比如，远古时期，我们的祖先打猎吃肉，他们本身之前是没有经验而言的，当有人用很粗的石头去割动物的皮的时候，发现很难把皮隔开，但是又有人用很薄的石头去割，发现比别人更加容易的隔开动物的毛皮，于是，第二天、第三天、……，他们就知道了需要寻找比较薄的石头片来割。这些就是无监督学习的思想，外界没有经验和训练数据样本提供给它们，完全靠自己摸索。

增强学习（reinforcement learning）

增强学习又叫做强化学习，是近年来机器学习和智能控制领域的主要方法之一。它是机器学习中一个非常活跃且有趣的领域，相比其他学习方法，增强学习更接近生物学习的本质，因此有望获得更高的智能。

增强学习关注的是智能体如何在环境中采取一系列行为，从而获得最大的累积回报。通过增强学习，一个智能体应该知道在什么状态下应该采取什么行为。增强学习是从环境状态到动作的映射的学习，我们把这个映射称为策略。

举个例子

比如之前很火的一款小游戏flappy bird。如果我们给它设计一个增强学习算法，然后让小鸟不断的进行游戏，如果小鸟撞到柱子了，那就获得-1的回报，否则获得0回报。通过这样的若干次训练，我们最终可以得到一只飞行技能高超的小鸟，它知道在什么情况下采取什么动作来躲避柱子。

机器学习就像一座迷宫，其中有许多微妙之处和陷阱，容易令人失去路径。它看起来是一个完美的思考机器，其实并不是。基本理论的每一部分几乎都可以被拿来无休止地测试和改变，结果往往很有趣。

本文转自微信公众号：超多维SuperD

无监督学习监督学习机器学习技术机器学习

著作权归作者所有

如果觉得我的文章对您有用，请点赞。您的支持将鼓励我继续创作！

添加新评论0 条评论

Ctrl+Enter 发表

匿名评论

轻松读懂机器学习的三大类别

监督学习（supervised learning）

举个例子

无监督学习（unsupervised learning）

举个例子

增强学习（reinforcement learning）

举个例子

添加新评论0 条评论

作者其他文章

相关文章

相关问题

相关资料