1.2 机器学习是什么?

参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv

机器学习是什么?在本视频中,我们会尝试着进行定义,同时让你懂得何时会使用机 器学习。实际上,即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确 定义机器学习是什么或不是什么,现在我将告诉你一些人们尝试定义的示例。第一个机器学 习的定义来自于 Arthur Samuel。他定义机器学习为,在进行特定编程的情况下,给予计算

机学习能力的领域。Samuel 的定义可以回溯到 50 年代,他编写了一个西洋棋程序。这程序 神奇之处在于,编程者自己并不是个下棋高手。但因为他太菜了,于是就通过编程,让西洋 棋程序自己跟自己下了上万盘棋。通过观察哪种布局(棋盘位置)会赢,哪种布局会输,久

而久之,这西洋棋程序明白了什么是好的布局,什么样是坏的布局。然后就牛逼大发了,程 序通过学习后,玩西洋棋的水平超过了 Samuel。这绝对是令人注目的成果。

尽管编写者自己是个菜鸟,但因为计算机有着足够的耐心,去下上万盘的棋,没有人有

这耐心去下这么多盘棋。通过这些练习,计算机获得无比丰富的经验,于是渐渐成为了比 Samuel 更厉害的西洋棋手。上述是个有点不正式的定义,也比较古老。另一个年代近一点 的定义,由 Tom Mitchell 提出,来自卡内基梅隆大学,Tom 定义的机器学习是,一个好的学 习问题定义如下,他说,一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值

P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。我认为经验 e 就是程序上万次的自我练习的经验而任务 t 就是下棋。性能度量值 p 呢,就是它在与一 些新的对手比赛时,赢得比赛的概率。

在这些视频中,除了我教你的内容以外,我偶尔会问你一个问题,确保你对内容有所理 解。说曹操,曹操到,顶部是 Tom Mitchell 的机器学习的定义,我们假设您的电子邮件程序 会观察收到的邮件是否被你标记为垃圾邮件。在这种 Email 客户端中,你点击“垃圾邮件”

按钮,报告某些 email 为垃圾邮件,不会影响别的邮件。基于被标记为垃圾的邮件,您的电 子邮件程序能更好地学习如何过滤垃圾邮件。请问,在这个设定中,任务 T 是什么?几秒钟 后,该视频将暂停。当它暂停时,您可以使用鼠标,选择这四个单选按钮中的一个,让我知 道这四个,你所认为正确的选项。它可能是性能度量值 P。所以,以性能度量值 P 为标准,

这个任务的性能,也就是这个任务 T 的系统性能,将在学习经验 E 后得到提高。

本课中,我希望教你有关各种不同类型的学习算法。目前存在几种不同类型的学习算法。 主要的两种类型被我们称之为监督学习和无监督学习。在接下来的几个视频中,我会给出这 些术语的定义。这里简单说两句,监督学习这个想法是指,我们将教计算机如何去完成任务, 而在无监督学习中,我们打算让它自己进行学习。如果对这两个术语仍一头雾水,请不要担 心,在后面的两个视频中,我会具体介绍这两种学习算法。此外你将听到诸如,强化学习和 推荐系统等各种术语。这些都是机器学习算法的一员,以后我们都将介绍到,但学习算法最 常用两个类型就是监督学习、无监督学习。我会在接下来的两个视频中给出它们的定义。本 课中,我们将花费最多的精力来讨论这两种学习算法。而另一个会花费大量时间的任务是了 解应用学习算法的实用建议。

我非常注重这部分内容,实际上,就这些内容而言我不知道还有哪所大学会介绍到。给 你讲授学习算法就好像给你一套工具,相比于提供工具,可能更重要的,是教你如何使用这 些工具。我喜欢把这比喻成学习当木匠。想象一下,某人教你如何成为一名木匠,说这是锤 子,这是螺丝刀,锯子,祝你好运,再见。这种教法不好,不是吗?你拥有这些工具,但更 重要的是,你要学会如何恰当地使用这些工具。会用与不会用的人之间,存在着鸿沟。尤其 是知道如何使用这些机器学习算法的,与那些不知道如何使用的人。在硅谷我住的地方,当 我走访不同的公司,即使是最顶尖的公司,很多时候我都看到人们试图将机器学习算法应用 于某些问题。有时他们甚至已经为此花了六个月之久。但当我看着他们所忙碌的事情时,我 想说,哎呀,我本来可以在六个月前就告诉他们,他们应该采取一种学习算法,稍加修改进 行使用,然后成功的机会绝对会高得多所以在本课中,我们要花很多时间来探讨,如果你真 的试图开发机器学习系统,探讨如何做出最好的实践类型决策,才能决定你的方式来构建你 的系统,这样做的话,当你运用学习算法时,就不太容易变成那些为寻找一个解决方案花费

6 个月之久的人们的中一员。他们可能已经有了大体的框架,只是没法正确的工作于是这就 浪费了六个月的时间。所以我会花很多时间来教你这些机器学习、人工智能的最佳实践以及 如何让它们工作,我们该如何去做,硅谷和世界各地最优秀的人是怎样做的。我希望能帮你 成为最优秀的人才,通过了解如何设计和构建机器学习和人工智能系统。

这就是机器学习,这些都是我希望讲授的主题。在下一个视频里,我会定义什么是监督 学习,什么是无监督学习。此外,探讨何时使用二者。