同现购买

协同过滤为用户做推荐的依据包括：所有人购物的历史纪录，还有用户和商品之间的一般化的关联关系，显然当我们为用户推荐商品的时候，如果有人买过这件商品，而且可能他们大部分还同时都买过其它的某些物品，我们有必要将这些过去一起买的商品推荐给此时买这件商品的用户。也有可能有些商品不是同时买的，但只要在历史购物的记录里就可以考虑，这样就有了同现购买的概念。

比如买尿布的人同样买了婴儿湿巾，如果我们刚刚买了尿布，那么如何使用同现购买现象帮助我们做出推荐呢？

同现矩阵

首先先来看一下同现矩阵是什么样的？

基于机器学习的协同过滤算法完成电子商务网站的商品推荐系统

同现矩阵

这个同现矩阵是一个对称矩阵，其中每一行表示一件商品，所有行就表示所有的商品。每一列同样也表示一件商品，所有列就表示所有的商品，行i与列j相交的位置就是即买这个商品i又买那个商品j的用户数。

因为这是一个对称矩阵，所以同时买物品i和j的用户个数，和同时买物品j和i的用户个数是一样的。只要有人买尿布和其它的商品，我们就将对应的位置加1.

现在同现矩阵已经有了，现在我们如何使用同现矩阵来做商品推荐？

使用同现矩阵做商品推荐

假设有一个用户刚买了尿布，我们找到同现矩阵的尿布行，将该行提取出来

基于机器学习的协同过滤算法完成电子商务网站的商品推荐系统

同现矩阵的尿布行

然后我们就可以将最大计数的商品作为推荐，我们发现婴儿湿巾的数量为100，所以商品推荐系统和很有可能给购买了尿布的人推荐婴儿湿巾。

使用同现矩阵做商品推荐的问题

如果有一件商品非常流行，那么会出现什么问题？

比如对于家里有婴儿的用户来说，婴儿的尿布非常流行，几乎所有用户在购买婴儿类商品的时候都会购买尿布。那么对于这些用户来说只要购买婴儿类产品（比如长颈鹿咀嚼器）的时候，系统会从同现矩阵中取出长颈鹿咀嚼器行：

基于机器学习的协同过滤算法完成电子商务网站的商品推荐系统

同现矩阵长颈鹿咀嚼器行

我们会发现尿布永远都是次数最多的，所以如果按照这个来推荐给用户的话，我们可以发现只要购买婴儿类的产品就会推荐尿布，这个看起来很正常，但是缺乏了个性化，淹没了其它的产品（也就是说很多人买了尿布，并不代表买了长颈鹿咀嚼器的用户也想买尿布），要想克服这么问题，使其更加个性化，我们需要解决流行商品推荐力度过强的问题。我们可以将同现矩阵正规化，我们常常使用矩阵正规化的方法叫做Jaccard相似度。

同现矩阵正规化

具体来说就是同时买商品i和j的人的数量除以买商品i或j的人的数量

基于机器学习的协同过滤算法完成电子商务网站的商品推荐系统

同现矩阵正规化

这个操作叫做Jaccard相似度，它也有一些局限性，它只考虑当前的购买行为，也就是它只根据当前用户购买的商品来推荐，不考虑历史的购买行为，要想解决这个问题，我们需要对所有的购物历史都加上权重系数（将最近购买的设置大一些的权重，对买的比较时间长的商品设置小一些的权重），然后给所有可能推荐的商品打个分。

比如来说，用户A购买过商品{尿布，牛奶}，现在要对用户A进行推荐，那么模型将浏览所有可能推荐给A的商品，并对它们进行打分

基于机器学习的协同过滤算法完成电子商务网站的商品推荐系统