十六、推荐系统(Recommender Systems) 16.1 问题形式化
参考视频: 16 - 1 - Problem Formulation (8 min).mkv
在接下来的视频中,我想讲一下推荐系统。我想讲推荐系统有两个原因: 第一、仅仅因为它是机器学习中的一个重要的应用。在过去几年,我偶尔访问硅谷不同
的技术公司,我常和工作在这儿致力于机器学习应用的人们聊天,我常问他们,最重要的机 器学习的应用是什么,或者,你最想改进的机器学习应用有哪些。我最常听到的答案是推荐 系统。现在,在硅谷有很多团体试图建立很好的推荐系统。因此,如果你考虑网站像亚马逊,
或网飞公司或易趣,或 iTunes Genius,有很多的网站或系统试图推荐新产品给用户。如,亚 马逊推荐新书给你,网飞公司试图推荐新电影给你,等等。这些推荐系统,根据浏览你过去 买过什么书,或过去评价过什么电影来判断。这些系统会带来很大一部分收入,比如为亚马
逊和像网飞这样的公司。因此,对推荐系统性能的改善,将对这些企业的有实质性和直接的 影响。
推荐系统是个有趣的问题,在学术机器学习中因此,我们可以去参加一个学术机器学习 会议,推荐系统问题实际上受到很少的关注,或者,至少在学术界它占了很小的份额。但是, 如果你看正在发生的事情,许多有能力构建这些系统的科技企业,他们似乎在很多企业中占 据很高的优先级。这是我为什么在这节课讨论它的原因之一。
我想讨论推荐系统地第二个原因是:这个班视频的最后几集我想讨论机器学习中的一些 大思想,并和大家分享。这节课我们也看到了,对机器学习来说,特征是很重要的,你所选 择的特征,将对你学习算法的性能有很大的影响。因此,在机器学习中有一种大思想,它针 对一些问题,可能并不是所有的问题,而是一些问题,有算法可以为你自动学习一套好的特 征。因此,不要试图手动设计,而手写代码这是目前为止我们常干的。有一些设置,你可以 有一个算法,仅仅学习其使用的特征,推荐系统就是类型设置的一个例子。还有很多其它的, 但是通过推荐系统,我们将领略一小部分特征学习的思想,至少,你将能够了解到这方面的 一个例子,我认为,机器学习中的大思想也是这样。因此,让我们开始讨论推荐系统问题形 式化。
我们从一个例子开始定义推荐系统的问题。
假使我们是一个电影供应商,我们有 5 部电影和 4 个用户,我们要求用户为电影打分。
前三部电影是爱情片,后两部则是动作片,我们可以看出 Alice 和 Bob 似乎更倾向与爱 情片, 而 Carol 和 Dave 似乎更倾向与动作片。并且没有一个用户给所有的电影都打过分。 我们希望构建一个算法来预测他们每个人可能会给他们没看过的电影打多少分,并以此作为 推荐的依据。
下面引入一些标记: nu 代表用户的数量 nm 代表电影的数量
r(i,j)如果用户 i 给电影 j 评过分则 r(i,j)=1 y(i,j)代表用户 i 给电影 j 的评分
mj 代表用户 j 评过分的电影的总数