引荐系统(4)—协同过滤算法

投资理财
2019-03-02 12:49:51 0

+关注

简介

个性化推荐算法主要包括多种类型，其中协同过滤算法（Collaborative Filtering, CF）应用较为广泛。本文将简要介绍协同过滤算法的工作原理及其优缺点。

协同过滤算法原理

协同过滤算法通过汇总所有用户对项目的反馈，利用集体智慧进行推荐。其工作原理类似于朋友推荐，例如通过分析用户喜好，发现用户A和用户B有相似的品味，而用户B喜欢某个项目，用户A却没有喜欢过，那么就可以将这个项目推荐给用户A。（用户基础的协同过滤，User-Based CF）

此外，还有一种基于项目的协同过滤（Item-Based CF）。这种算法通过对比所有数据，发现项目A和项目B非常相似（它们被相似的用户群体所喜爱），然后将用户A喜欢的所有项目中相似的项目推荐给用户A。

个性化推荐与相关推荐

个性化推荐通常基于上述两种协同过滤方法实现，而相关推荐则可以直接使用基于项目的协同过滤的中间结果。

优点

能够提供意外的推荐结果，经常能推荐出一些惊喜；
仅依赖用户行为，无需深入了解项目内容；
应用范围广泛。

缺点

需要大量的用户与项目行为数据才能有效运行；
对于新用户，缺乏足够的行为数据，难以做出有效的推荐；
缺乏合理的推荐解释。

协同过滤算法的具体实现

协同过滤算法在具体实现时分为两大类：基于用户的协同过滤和基于项目的协同过滤。

基于用户的协同过滤

基于用户的协同过滤算法主要通过计算用户间的相似度来进行推荐。计算公式如下：

[ text{similarity}(u, v) = frac{sum{i in I(uv)} (R(u, i) - overline{R}(u)) times (R(v, i) - overline{R}(v))}{sqrt{sum{i in I(uv)} (R(u, i) - overline{R}(u))^2} times sqrt{sum_{i in I(uv)} (R(v, i) - overline{R}(v))^2}} ]

其中，(I(uv))表示用户u和v共同评价过的项目集合，(R(u, i))表示用户u对项目i的评分，(overline{R}(u))表示用户u所有评分的平均分。通过减去平均分，可以避免某些用户评分过高或过低带来的影响。

基于项目的协同过滤

基于项目的协同过滤算法与基于用户的协同过滤算法类似，但计算的是项目间的相似度。

基于模型的协同过滤算法

除了基于用户的协同过滤和基于项目的协同过滤之外，还有许多基于模型的协同过滤算法。其中，基于矩阵分解的潜在语义模型是一种常见的方法。该算法通过将稀疏矩阵分解为两个矩阵相乘，从而简化计算过程。在实际应用中，这种方法可以有效地处理大规模数据集，并提升推荐系统的性能。

组合推荐技术

单一的推荐技术往往存在局限性，因此组合推荐技术成为一种有效的解决方案。常见的组合推荐技术包括： - 混合推荐技术：结合多种推荐技术并加权取最优； - 切换推荐技术：根据用户场景选择不同的推荐技术； - 特征组合推荐技术：将一种推荐技术的输出作为特征加入另一种推荐技术中； - 层叠推荐技术：一个推荐模块从另一个推荐模块中获取结果用于自身产出。