0%

推荐系统入门知识

推荐系统分类

基于内容推荐

根据用户和项目的固有属性分别构建特征。然后计算用户和项目的距离

协同过滤的推荐 (CF)

协同过滤方法主要是计算用户间的相似性,然后把相似用户的喜好推送给目标用户。

基于内存的系统过滤 (Memory-based CF)

该方法大致分为两步:计算相似度;推荐把相似但未发生的项目。根据用户维度和项目维度可分为Item-based CF和User-based CF

Item-based CF
  1. 构建UI矩阵
  2. 计算item维度的相似度
  3. 计算选定item最相似的K个项目,得到推荐列表
  4. 构建用户还没发生行为的item
User-based CF
  1. 构建UI矩阵
  2. 计算user维度的相似度
  3. 选定最相似的K个用户
  4. 推荐与用户未发生过行为且在相似用户中发生的高频item

基于模型的协同过滤 (Model-based CF)

利用分类算法,回归算法、聚类算法、矩阵分解算法、神经网络算法、图模型算法以及隐语义模型等机器学习方法计算

  • FunkSVD, MF

    把评分矩阵分解为用户和项目两部分,目标为

    为防止过拟合,funcSVD加入了L2的正则项

  • BiasSVD

    在FuncSVD的基础上,加入了bias

  • SVD++

    又在BiasSVD的基础上考虑了用户的隐式反馈 其中是用户产生行为的集合,是项目的个人喜好偏置;是一个经验公式。

  • factorization machines (FM)

    针对输出数据特别稀疏的问题,考虑特征与特征之间的关系 其中是两个维度维向量的内积:

  • Bayesian Personalized Ranking (BPR)

    利用已有的用户偏好信息,构建偏序关系。在这些偏序关系上利用贝叶斯公式计算偏序的概率。

  • Collaborative Metric Learning (CML)

    距离学习,最小化相似user-item的距离,最大化不相似user-item的距离。

混合的推荐

多种方法的混合

评测指标

评分预测

对user-item对的得分进行预测,这是一个回归问题。一般用RMSE, MAE等进行评价 - RMSE

  • MAE ### TOP-K 列表推荐

此时,真实列表与推荐列表的。用分别代表用户的真实行为和预测行为列表。