推荐系统实践 笔记

诸神缄默不语-个人CSDN博文目录

这是我2020年写的笔记,我从印象笔记搬过来公开。
如果那年还在读本科的同学也许有印象,那年美赛出了道根据电商评论给商户提建议的题。其实这件事跟推荐系统关系不大,但我们当时病急乱投医,我打开了这本书。
然后发现还蛮好玩的就看完了。

这本书写于2012年,哦多么古早的时代……
小书,读得很快,但是能让用户迅速对早期推荐系统有个通览的了解。
如果我以后真的干推荐系统了,可能会再回来更新相应笔记内容。

文章目录

  • 第一章 好的推荐系统
  • 第二章 利用用户行为数据
    • 2.1 用户行为数据
    • 2.2 用户行为分析
  • 第三章 推荐系统冷启动问题
  • 第四章 利用用户标签数据
  • 第五章 利用上下文信息
  • 第六章 利用社交网络数据
  • 第七章 推荐系统实例
  • 第八章 评分预测问题
  • 其他来源的相关参考资料
    • 豆瓣书评
    • 知乎
    • CSDN
    • 博客园
    • 豆瓣用户整理的附录和参考资料

第一章 好的推荐系统

  1. 在推荐系统中,主要有3种评测推荐效果的实验方法,即离线实验( offline experiment)、用户调查( user study)和在线实验( online experiment)。
    1. 离线实验
      离线实验的方法一般由如下几个步骤构成:
      1. 通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集;
      2. 将数据集按照一定的规则分成训练集和测试集;
      3. 在训练集上训练用户兴趣模型,在测试集上进行预测;
      4. 通过事先定义的离线指标评测算法在测试集上的预测结果。
    2. 用户调查:尽量是双盲实验
    3. 在线实验:AB测试
      1. 周期长
      2. 切分流量(正交):控制变量,以防互相干扰
  2. 推荐系统评测指标
    1. 用户满意度
      1. 用户调查:问卷
      2. 在线实验:一些对用户行为的统计
    2. 预测准确度:离线数据集做机器学习
      1. 评分预测
        1. RMSE,MAE
        2. Netflix认为RMSE加大了对预测不准的用户物品评分的惩罚(平方项的惩罚),因而对系统的评测更加苛刻。研究表明,如果评分系统是基于整数建立的(即用户给的评分都是整数),那么对预测结果取整会降低MAE的误差
      2. TopN推荐: 给用户一个个性化的推荐列表
        1. 准确率( precision) /召回率( recall)
        2. 用户在训练集上的行为给用户作出的推荐列表
        3. 用户在测试集上的行为列表
        4. 有的时候,为了全面评测TopN推荐的准确率和召回率,一般会选取不同的推荐列表长度N,计算出一组准确率/召回率,然后画出准确率/召回率曲线( precision/recall curve)
      3. 覆盖率( coverage):描述一个推荐系统对物品长尾的发掘能力
        1. 最简单的定义:推荐系统能够推荐出来的物品占总物品集合的比例
        2. 内容提供商会关心这一指标
        3. 其他衡量指标:信息熵、基尼系数
          在这里插入图片描述
      4. 多样性
        在这里插入图片描述
        在这里插入图片描述
      5. 新颖性:给用户推荐那些他们以前没有听说过的物品
      6. 惊喜度 (serendipity):如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高,而推荐的新颖性仅仅取决于用户是否听说过这个推荐结果
      7. 信任度( trust)
        1. 提高推荐系统的信任度的方法
          1. 增加推荐系统的透明度( transparency):主要办法是提供推荐解释。只有让用户了解推荐系统的运行机制,让用户认同推荐系统的运行机制,才会提高用户对推荐系统的信任度
          2. 考虑用户的社交网络信息,利用用户的好友信息给用户做推荐,并且用好友进行推荐解释。这是因为用户对他们的好友一般都比较信任,因此如果推荐的商品是好友购买过的,那么他们对推荐结果就会相对比较信任。
      8. 实时性
        1. 实时地更新推荐列表来满足用户新的行为变化
        2. 推荐系统需要能够将新加入系统的物品推荐给用户
      9. 健壮性(即robust,鲁棒性)指标:一个推荐系统抗击作弊的能力
        1. 著名作弊方法: 行为注入攻击 ( profile injection attack)
        2. 评测的主要方法:模拟攻击
        3. 提高系统健壮性的方法
          1. 选择健壮性高的算法
          2. 设计推荐系统时尽量使用代价比较高的用户行为
          3. 在使用数据前,进行攻击检测,从而对数据进行清理
      10. 商业目标
      11. 在这里插入图片描述
      12. 评测维度
        1. 用户维度:主要包括用户的人口统计学信息、活跃度以及是不是新用户等。
        2. 物品维度:包括物品的属性信息、流行度、平均分以及是不是新加入的物品等。
        3. 时间维度:包括季节,是工作日还是周末,是白天还是晚上等。

第二章 利用用户行为数据

2.1 用户行为数据

  1. 日志 会话日志
  2. 显性反馈行为( explicit feedback)和隐性反馈行为( implicit feedback)
  3. 正反馈和负反馈

2.2 用户行为分析

  1. 用户活跃度和物品流行度的分布:长尾分布 Power Law在这里插入图片描述
  2. 协同过滤算法
    1. 基于邻域的方法( neighborhood-based)
      1. 基于用户的协同过滤算法:这种算法给用户推荐和他兴趣相似的其他用户喜欢的物品。
        基于用户的协同过滤算法主要包括两个步骤:
        1. 第一步:找到和目标用户兴趣相似的用户集合。
          1. 关键:计算两个用户的兴趣相似度
          2. 协同过滤算法主要利用行为的相似度计算兴趣的相似度
        2. 第二步:找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
          1. 物品-用户倒排表
          2. UserCF算法会给用户推荐和他兴趣最相似的K个用户喜欢的物品
            在这里插入图片描述
        3. 缺点
          1. 首先,随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难,其运算时间复杂度和空间复杂度的增长和用户数的增长近似于平方关系
          2. 其次,基于用户的协同过滤很难对推荐结果作出解释
      2. 基于物品的协同过滤算法ItemCF:这种算法给用户推荐和他之前喜欢的物品相似的物品
        基于物品的协同过滤算法主要分为两步:
        1. 第一步:计算物品之间的相似度。
        2. 第二步:根据物品的相似度和用户的历史行为给用户生成推荐列表。
        3. 用ItemCF算法计算物品相似度时也可以首先建立用户—物品倒排表(即对每个用户建立一个包含他喜欢的物品的列表),然后对于每个用户,将他物品列表中的物品两两在共现矩阵C中加1。
          在这里插入图片描述
          在这里插入图片描述在这里插入图片描述
        4. 哈利波特问题:惩罚热门商品
    2. LFM隐语义模型( latent factor model)
      1. 物品分类(属于每个类的权重)
        在这里插入图片描述
      2. 隐性反馈行为的负样本采集
    3. 基于图的随机游走算法( random walk on graph)
      1. 用户行为数据的二分图表示
      2. 基于图的推荐算法
        1. 给用户u推荐物品的任务就可以转化为度量用户顶点和与没有边直接相连的物品节点在图上的相关性,相关性越高的物品在推荐列表中的权重就越高。
        2. 一般来说图中顶点的相关性主要取决于下面3 个因素:
          1. 两个顶点之间的路径数
          2. 两个顶点之间路径的长度
          3. 两个顶点之间的路径经过的顶点
        3. 基于随机游走的PersonalRank算法

第三章 推荐系统冷启动问题

  1. 用户冷启动
  2. 物品冷启动
  3. 系统冷启动

  1. 提供非个性化的推荐:非个性化推荐的最简单例子就是热门排行榜,我们可以给用户推荐热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐。
  2. 利用用户注册时提供的年龄、性别等数据做粗粒度的个性化。
    1. 用户的注册信息分3种:
    2. 人口统计学信息:包括用户的年龄、性别、职业、民族、学历和居住地。
    3. 用户兴趣的描述:有一些网站会让用户用文字描述他们的兴趣。
    4. 从其他网站导入的用户站外行为数据:比如用户通过豆瓣、新浪微博的账号登录,就可以在得到用户同意的情况下获取用户在豆瓣或者新浪微博的一些行为数据和社交网络数据。
    5. 基于注册信息的个性化推荐流程基本如下:
    6. (1) 获取用户的注册信息;
    7. (2) 根据用户的注册信息对用户分类;
    8. (3) 给用户推荐他所属分类中用户喜欢的物品。
  3. 利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品。
  4. 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品。
    1. 启动物品的特点:比较热门、具有代表性和区分性、启动物品集合要有多样性
    2. 决策树
      在这里插入图片描述
  5. 对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户。
    在这里插入图片描述
    1. 话题模型LDA(物品的话题分布相似度:KL散度)
  6. 在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。

第四章 利用用户标签数据

在这里插入图片描述

  1. 标签:特征表现方式
  2. 根据给物品打标签的人的不同,标签应用一般分为两种
    1. 一种是让作者或者专家给物品打标签
    2. 另一种是让普通用户给物品打标签,也就是UGC( User Generated Content,用户生成的内容)的标签应用。
  3. UGC
    1. 标签系统中的推荐问题主要有以下两个。
    2. 如何利用用户打标签的行为为其推荐物品(基于标签的推荐)?
    3. 如何在用户给物品打标签时为其推荐适合该物品的标签(标签推荐)?
  4. 标签扩展(标签相似度)
    1. 话题模型
    2. 基于邻域的方法
      在这里插入图片描述
  5. 标签清理
    1. 有的标签不反应用户兴趣
    2. 有的标签是同义词
    3. 将标签作为推荐解释
    4. 方法
      1. 去除词频很高的停止词
      2. 去除因词根不同造成的同义词
      3. 去除因分隔符造成的同义词
  6. 基于图的推荐算法
    1. 节点:用户、物品、标签
    2. SimpleTagGraph
    3. PersonalRank
  7. 给用户推荐标签
    1. 方便用户输入
    2. 提高数据质量(同义词)
    3. 推荐的标签:热门标签,该物品常用,该用户常用
    4. 对新用户/新物品
      1. 抽取关键词作为标签
      2. 扩展标签(见上)
    5. 基于图的标签推荐算法

第五章 利用上下文信息

  1. 时间
    1. 用户历史兴趣变化
    2. 物品生命周期
    3. 季节效应
    4. 节日效应
    5. 推荐算法的时间多样性
      1. 实时推荐系统
      2. 在生成推荐结果时加入一定的随机性
      3. 对较久远的行为降权
      4. 随机应用不同的推荐算法
      5. 最近最热门
      6. ItemCF算法(数学衰减函数)
      7. UserCF算法(相似兴趣用户的最近行为)
      8. 时间段图模型(路径融合算法)
  2. 地点
    1. 基于位置的服务LBS
    2. (明尼苏达大学)LARS位置感知推荐系统
      1. 物品/用户:有无空间属性
      2. 用户有地理位置——金字塔模型:树,ItemCF。每一层训练推荐模型,叠加
      3. 物品有地理位置——TravelPenalty
  3. 心情

第六章 利用社交网络数据

  1. 社会化推荐
    1. 增加推荐的信任度
    2. 解决冷启动问题
  2. 社交图谱/兴趣图谱
  3. 双向确认的社交网络数据/单向关注的社交网络数据/基于社区的社交网络数据
  4. 基于邻域的社会化推荐算法
    1. 用户之间的熟悉程度(共同好友比例)
    2. 用户之间的兴趣相似度
  5. friendship/membership(同一社区)
  6. 时效问题——解决方案:做截断(只用相似度最高的N个好友、只用1个月的行为等)、重新设计数据库(Twitter的消息队列,每次更新都把所有人的写一遍)
  7. 评测:用户调查和在线实验(AB Test)
  8. 信息流推荐(Facebook的EdgeRank)
  9. 给用户推荐好友:链路预测link prediction
    1. 基于内容的匹配
    2. 基于共同兴趣的好友
    3. 基于社交网络图的好友推荐
  10. 随机图
  11. 中心度

第七章 推荐系统实例

外围架构
在这里插入图片描述

按照前面数据的规模和是否需要实时存取,不同的行为数据将被存储在不同的媒介中。一般来说,需要实时存取的数据存储在数据库和缓存中,而大规模的非实时地存取数据存储在分布式文件系统(如HDFS)中。

  1. 推荐系统架构
    1. 生成用户特征(人口统计学特征、行为特征、话题特征(历史行为→话题模型))
    2. 根据特征找到物品
      在这里插入图片描述
  2. 推荐引擎架构
    在这里插入图片描述
    1. 生成用户特征向量
      1. 特征和特征的权重
      2. 用户行为的种类(代价反映的偏爱)
      3. 用户行为产生的时间
      4. 用户行为的次数
      5. 物品的热门程度
    2. 生成用户推荐物品列表
    3. 过滤(用户已经产生过行为物品、候选物品以外的物品、某些质量很差的物品(用户评分))
    4. 排名
      1. 新颖性排名(内容相似度矩阵)
      2. 多样性(内容、属性上的)
      3. 时间多样性(实时性)
      4. 用户反馈(点击模型)

第八章 评分预测问题

  1. 前:TopN推荐
  2. 按时间划分数据集
  3. 评分预测算法
    1. 平均值
      1. 全局平均值
      2. 用户评分平均值
      3. 物品评分平均值
      4. 用户分类对物品分类的平均值
      5. 分类: 用户和物品的平均分, 用户活跃度和物品流行度
    2. 基于邻域的方法
    3. 隐语义模型与矩阵分解模型: 如何通过降维的方法将评分矩阵补全
      1. SVD分解
      2. Funk-SVD/LFM
      3. 加入偏置项后的LFM
      4. 考虑邻域影响的LFM
    4. 加入时间信息
      1. 基于邻域的模型融合时间信息
      2. 基于矩阵分解的模型融合时间信息
    5. 模型融合
      1. 模型级联融合
      2. 模型加权融合

其他来源的相关参考资料

豆瓣书评

  1. 新一代推荐系统包含三个子模块
    1. 前台的展示页面
    2. 后台的日志系统
    3. 推荐算法系统
  2. 社交网站的API接口:好友行为

知乎

  1. 入门推荐系统,你不应该错过的知识清单 - 第四范式 先荐的文章 - 知乎
  2. 推荐系统入门要点哪些技能树? - 知乎

CSDN

  1. 《推荐系统实践》项亮 书中程序实现
  2. 推荐系统案例

博客园

  1. 协同滤波 Collaborative filtering 《推荐系统实践》 第二章

豆瓣用户整理的附录和参考资料

附上Reference 中的干货 (Paper,Blog等资料的链接)

http://en.wikipedia.org/wiki/Information_overload
P1

http://www.readwriteweb.com/archives/recommender_systems.php
(A Guide to Recommender System) P4

http://en.wikipedia.org/wiki/Cross-selling
(Cross Selling) P6

http://blog.kiwitobes.com/?p=58 , http://stanford2009.wikispaces.com/
(课程:Data Mining and E-Business: The Social Data Revolution) P7

http://thesearchstrategy.com/ebooks/an%20introduction%20to%20search%20engines%20and%20web%20navigation.pdf
(An Introduction to Search Engines and Web Navigation) p7

http://www.netflixprize.com/
p8

http://cdn-0.nflximg.com/us/pdf/Consumer_Press_Kit.pdf
p9

http://stuyresearch.googlecode.com/hg-history/c5aa9d65d48c787fd72dcd0ba3016938312102bd/blake/resources/p293-davidson.pdf
(The Youtube video recommendation system) p9

http://www.slideshare.net/plamere/music-recommendation-and-discovery
( PPT: Music Recommendation and Discovery) p12

http://www.facebook.com/instantpersonalization/
P13

http://about.digg.com/blog/digg-recommendation-engine-updates
(Digg Recommendation Engine Updates) P16

http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36955.pdf
(The Learning Behind Gmail Priority Inbox)p17

http://www.grouplens.org/papers/pdf/mcnee-chi06-acc.pdf
(Accurate is not always good: How Accuracy Metrics have hurt Recommender Systems) P20

http://www-users.cs.umn.edu/~mcnee/mcnee-cscw2006.pdf
(Don’t Look Stupid: Avoiding Pitfalls when Recommending Research Papers)P23

http://www.sigkdd.org/explorations/issues/9-2-2007-12/7-Netflix-2.pdf
(Major componets of the gravity recommender system) P25

http://cacm.acm.org/blogs/blog-cacm/22925-what-is-a-good-recommendation-algorithm/fulltext
(What is a Good Recomendation Algorithm?) P26

http://research.microsoft.com/pubs/115396/evaluationmetrics.tr.pdf
(Evaluation Recommendation Systems) P27

http://mtg.upf.edu/static/media/PhD_ocelma.pdf
(Music Recommendation and Discovery in the Long Tail) P29

http://ir.ii.uam.es/divers2011/
(Internation Workshop on Novelty and Diversity in Recommender Systems) p29

http://www.cs.ucl.ac.uk/fileadmin/UCL-CS/research/Research_Notes/RN_11_21.pdf
(Auralist: Introducing Serendipity into Music Recommendation ) P30

http://www.springerlink.com/content/978-3-540-78196-7/#section=239197&page=1&locus=21
(Metrics for evaluating the serendipity of recommendation lists) P30

http://dare.uva.nl/document/131544
(The effects of transparency on trust in and acceptance of a content-based art recommender) P31

http://brettb.net/project/papers/2007%20Trust-aware%20recommender%20systems.pdf
(Trust-aware recommender systems) P31

http://recsys.acm.org/2011/pdfs/RobustTutorial.pdf
(Tutorial on robutness of recommender system) P32

http://youtube-global.blogspot.com/2009/09/five-stars-dominate-ratings.html
(Five Stars Dominate Ratings) P37

http://www.informatik.uni-freiburg.de/~cziegler/BX/
(Book-Crossing Dataset) P38

http://www.dtic.upf.edu/~ocelma/MusicRecommendationDataset/lastfm-1K.html
(Lastfm Dataset) P39

http://mmdays.com/2008/11/22/power_law_1/
(浅谈网络世界的Power Law现象) P39

http://www.grouplens.org/node/73/
(MovieLens Dataset) P42

http://research.microsoft.com/pubs/69656/tr-98-12.pdf
(Empirical Analysis of Predictive Algorithms for Collaborative Filtering) P49

http://vimeo.com/1242909
(Digg Vedio) P50

http://glaros.dtc.umn.edu/gkhome/fetch/papers/itemrsCIKM01.pdf
(Evaluation of Item-Based Top-N Recommendation Algorithms) P58

http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf
(Amazon.com Recommendations Item-to-Item Collaborative Filtering) P59

http://glinden.blogspot.com/2006/03/early-amazon-similarities.html
(Greg Linden Blog) P63

http://www.hpl.hp.com/techreports/2008/HPL-2008-48R1.pdf
(One-Class Collaborative Filtering) P67

http://en.wikipedia.org/wiki/Stochastic_gradient_descent
(Stochastic Gradient Descent) P68

http://www.ideal.ece.utexas.edu/seminar/LatentFactorModels.pdf
(Latent Factor Models for Web Recommender Systems) P70

http://en.wikipedia.org/wiki/Bipartite_graph
(Bipatite Graph) P73

http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=4072747&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D4072747
(Random-Walk Computation of Similarities between Nodes of a Graph with Application to Collaborative Recommendation) P74

http://www-cs-students.stanford.edu/~taherh/papers/topic-sensitive-pagerank.pdf
(Topic Sensitive Pagerank) P74

http://www.stanford.edu/dept/ICME/docs/thesis/Li-2009.pdf
(FAST ALGORITHMS FOR SPARSE MATRIX INVERSE COMPUTATIONS) P77

https://www.aaai.org/ojs/index.php/aimagazine/article/view/1292
(LIFESTYLE FINDER: Intelligent User Profiling Using Large-Scale Demographic Data) P80

http://research.yahoo.com/files/wsdm266m-golbandi.pdf
( adaptive bootstrapping of recommender systems using decision trees) P87

http://en.wikipedia.org/wiki/Vector_space_model
(Vector Space Model) P90

http://tunedit.org/challenge/VLNetChallenge
(冷启动问题的比赛) P92

http://www.cs.princeton.edu/~blei/papers/BleiNgJordan2003.pdf
(Latent Dirichlet Allocation) P92

http://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
(Kullback–Leibler divergence) P93

http://www.pandora.com/about/mgp
(About The Music Genome Project) P94

http://en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes
(Pandora Music Genome Project Attributes) P94

http://www.jinni.com/movie-genome.html
(Jinni Movie Genome) P94

http://www.shilad.com/papers/tagsplanations_iui2009.pdf
(Tagsplanations: Explaining Recommendations Using Tags) P96

http://en.wikipedia.org/wiki/Tag_(metadata)
(Tag Wikipedia) P96

http://www.shilad.com/shilads_thesis.pdf
(Nurturing Tagging Communities) P100

http://www.stanford.edu/~morganya/research/chi2007-tagging.pdf
(Why We Tag: Motivations for Annotation in Mobile and Online Media ) P100

http://www.google.com/url?sa=t&rct=j&q=delicious%20dataset%20dai-larbor&source=web&cd=1&ved=0CFIQFjAA&url=http%3A%2F%2Fwww.dai-labor.de%2Fen%2Fcompetence_centers%2Firml%2Fdatasets%2F&ei=1R4JUKyFOKu0iQfKvazzCQ&usg=AFQjCNGuVzzKIKi3K2YFybxrCNxbtKqS4A&cad=rjt
(Delicious Dataset) P101

http://research.microsoft.com/pubs/73692/yihgoca-www06.pdf
(Finding Advertising Keywords on Web Pages) P118

http://www.kde.cs.uni-kassel.de/ws/rsdc08/
(基于标签的推荐系统比赛) P119

http://delab.csd.auth.gr/papers/recsys.pdf
(Tag recommendations based on tensor dimensionality reduction)P119

http://www.l3s.de/web/upload/documents/1/recSys09.pdf
(latent dirichlet allocation for tag recommendation) P119

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.94.5271&rep=rep1&type=pdf
(Folkrank: A ranking algorithm for folksonomies) P119

http://www.grouplens.org/system/files/tagommenders_numbered.pdf
(Tagommenders: Connecting Users to Items through Tags) P119

http://www.grouplens.org/system/files/group07-sen.pdf
(The Quest for Quality Tags) P120

http://2011.camrachallenge.com/
(Challenge on Context-aware Movie Recommendation) P123

http://bits.blogs.nytimes.com/2011/09/07/the-lifespan-of-a-link/
(The Lifespan of a link) P125

http://www0.cs.ucl.ac.uk/staff/l.capra/publications/lathia_sigir10.pdf
(Temporal Diversity in Recommender Systems) P129

http://staff.science.uva.nl/~kamps/ireval/papers/paper_14.pdf
(Evaluating Collaborative Filtering Over Time) P129

http://www.google.com/places/
(Hotpot) P139

http://www.readwriteweb.com/archives/google_launches_recommendation_engine_for_places.php
(Google Launches Hotpot, A Recommendation Engine for Places) P139

http://xavier.amatriain.net/pubs/GeolocatedRecommendations.pdf
(geolocated recommendations) P140

http://www.nytimes.com/interactive/2010/01/10/nyregion/20100110-netflix-map.html
(A Peek Into Netflix Queues) P141

http://www.cs.umd.edu/users/meesh/420/neighbor.pdf
(Distance Browsing in Spatial Databases1) P142

http://www.eng.auburn.edu/~weishinn/papers/MDM2010.pdf
(Efficient Evaluation of k-Range Nearest Neighbor Queries in Road Networks) P143

http://blog.nielsen.com/nielsenwire/consumer/global-advertising-consumers-trust-real-friends-and-virtual-strangers-the-most/
(Global Advertising: Consumers Trust Real Friends and Virtual Strangers the Most) P144

http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36371.pdf
(Suggesting Friends Using the Implicit Social Graph) P145

http://blog.nielsen.com/nielsenwire/online_mobile/friends-frenemies-why-we-add-and-remove-facebook-friends/
(Friends & Frenemies: Why We Add and Remove Facebook Friends) P147

http://snap.stanford.edu/data/
(Stanford Large Network Dataset Collection) P149

http://www.dai-labor.de/camra2010/
(Workshop on Context-awareness in Retrieval and Recommendation) P151

http://www.comp.hkbu.edu.hk/~lichen/download/p245-yuan.pdf
(Factorization vs. Regularization: Fusing Heterogeneous
Social Relationships in Top-N Recommendation) P153

http://www.infoq.com/news/2009/06/Twitter-Architecture/
(Twitter, an Evolving Architecture) P154

http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=0CGQQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.165.3679%26rep%3Drep1%26type%3Dpdf&ei=dIIJUMzEE8WviQf5tNjcCQ&usg=AFQjCNGw2bHXJ6MdYpksL66bhUE8krS41w&sig2=5EcEDhRe9S5SQNNojWk7_Q
(Recommendations in taste related domains) P155

http://www.ercim.eu/publication/ws-proceedings/DelNoe02/RashmiSinha.pdf
(Comparing Recommendations Made by Online Systems and Friends) P155

http://techcrunch.com/2010/04/22/facebook-edgerank/
(EdgeRank: The Secret Sauce That Makes Facebook’s News Feed Tick) P157

http://www.grouplens.org/system/files/p217-chen.pdf
(Speak Little and Well: Recommending Conversations in Online Social Streams) P158

http://blog.linkedin.com/2008/04/11/learn-more-abou-2/
(Learn more about “People You May Know”) P160

http://domino.watson.ibm.com/cambridge/research.nsf/58bac2a2a6b05a1285256b30005b3953/8186a48526821924852576b300537839/$FILE/TR%202009.09%20Make%20New%20Frends.pdf
(“Make New Friends, but Keep the Old” – Recommending People on Social Networking Sites) P164

http://www.google.com.hk/url?sa=t&rct=j&q=social+recommendation+using+prob&source=web&cd=2&ved=0CFcQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.141.465%26rep%3Drep1%26type%3Dpdf&ei=LY0JUJ7OL9GPiAfe8ZzyCQ&usg=AFQjCNH-xTUWrs9hkxTA8si5fztAdDAEng
(SoRec: Social Recommendation Using Probabilistic Matrix) P165

http://olivier.chapelle.cc/pub/DBN_www2009.pdf
(A Dynamic Bayesian Network Click Model for Web Search Ranking) P177

http://www.google.com.hk/url?sa=t&rct=j&q=online+learning+from+click+data+spnsored+search&source=web&cd=1&ved=0CFkQFjAA&url=http%3A%2F%2Fwww.research.yahoo.net%2Ffiles%2Fp227-ciaramita.pdf&ei=HY8JUJW8CrGuiQfpx-XyCQ&usg=AFQjCNE_CYbEs8DVo84V-0VXs5FeqaJ5GQ&cad=rjt
(Online Learning from Click Data for Sponsored Search) P177

http://www.cs.cmu.edu/~deepay/mywww/papers/www08-interaction.pdf
(Contextual Advertising by Combining Relevance with Click Feedback) P177
http://tech.hulu.com/blog/2011/09/19/recommendation-system/
(Hulu 推荐系统架构) P178

http://mymediaproject.codeplex.com/
(MyMedia Project) P178

http://www.grouplens.org/papers/pdf/www10_sarwar.pdf
(item-based collaborative filtering recommendation algorithms) P185

http://www.stanford.edu/~koutrika/Readings/res/Default/billsus98learning.pdf
(Learning Collaborative Information Filters) P186

http://sifter.org/~simon/journal/20061211.html
(Simon Funk Blog:Funk SVD) P187

http://courses.ischool.berkeley.edu/i290-dm/s11/SECURE/a1-koren.pdf
(Factor in the Neighbors: Scalable and Accurate Collaborative Filtering) P190

http://nlpr-web.ia.ac.cn/2009papers/gjhy/gh26.pdf
(Time-dependent Models in Collaborative Filtering based Recommender System) P193

http://sydney.edu.au/engineering/it/~josiah/lemma/kdd-fp074-koren.pdf
(Collaborative filtering with temporal dynamics) P193

http://en.wikipedia.org/wiki/Least_squares
(Least Squares Wikipedia) P195

http://www.mimuw.edu.pl/~paterek/ap_kdd.pdf
(Improving regularized singular value decomposition for collaborative filtering) P195

http://public.research.att.com/~volinsky/netflix/kdd08koren.pdf
(Factorization Meets the Neighborhood: a Multifaceted
Collaborative Filtering Model) P195

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/125852.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【开发篇】十六、SpringBoot整合JavaMail实现发邮件

文章目录 0、相关协议1、SpringBoot整合JavaMail2、发送简单邮件3、发送复杂邮件 0、相关协议 SMTP(Simple Mail Transfer Protocol):简单邮件传输协议,用于发送电子邮件的传输协议POP3(Post Office Protocol - Versi…

RabbitMQ集群搭建详细介绍以及解决搭建过程中的各种问题——实操型

RabbitMQ集群搭建详细介绍以及解决搭建过程中的各种问题——实操型 1. 准备工作1.1 安装RabbitMQ1.2 简单部署搭建设计1.3 参考官网 2. RabbitMQ 形成集群的方法3. 搭建RabbitMQ集群3.1 部署架构3.2 rabbitmq集群基础知识3.2.1 关于节点名称(标识符)3.2.…

鱼眼相机去畸变(图像拉直/展开/矫正)算法及实战总结

本文介绍两种方法 1、经纬度矫正法 2、棋盘格矫正法 一、经纬度矫正法 1、算法说明 经纬度矫正法, 可以把鱼眼图想象成半个地球, 然后将地球展开成地图,经纬度矫正法主要是利用几何原理, 对图像进行展开矫正。 经过P点的入射光线…

掌握交易时机!

“您是否知道您选择购买和出售加密货币的时间会产生很大的影响?当然,大多数交易者都知道高价卖出和低价买入的基本知识。然而,在选择交易加密货币的最佳时机时,还需要考虑许多其他小细节。加密货币市场分析表明,一天中…

中秋时节赏明月,五子棋戏月饼趣 — Flutter中秋限定版五子棋

前言 当中秋时节来临,我们都期待着与亲人朋友共度这个美好的节日。这个时候,除了传统的赏月和品尝美味的月饼,我还有一个特别的建议——尝试一款有趣的Flutter五子棋游戏!这款五子棋游戏以中秋为主题,游戏的棋子也可爱…

阿里云服务器IP地址查询方法(公网IP和私网IP)

阿里云服务器IP地址在哪查看?在云服务器ECS管理控制台即可查看,阿里云服务器IP地址包括公网IP和私有IP地址,阿里云百科分享阿里云服务器IP地址查询方法: 目录 阿里云服务器IP地址查询 阿里云服务器IP地址查询 1、登录到阿里云服…

数据结构:二叉树(超详解析)

目录​​​​​​​ 1.树概念及结构 1.1树的概念 1.2树的相关概念 1.3树的表示 1.3.1孩子兄弟表示法: 1.3.2双亲表示法:只存储双亲的下标或指针 两节点不在同一树上: 2.二叉树概念及结构 2.1.概念 2.2.特殊的二叉树: 2…

ESP32/ESP8266在线刷写Sonoff Tasmota固件以及配置简要

ESP32/ESP8266在线刷写Sonoff Tasmota固件以及配置简要 📍原项目Github地址:https://github.com/arendst/Tasmota/tree/v13.1.0📑官方文档介绍:https://tasmota.github.io/docs/🚩(✨推荐方式✨)在线固件刷写地址&…

【数据结构】排序算法(二)—>冒泡排序、快速排序、归并排序、计数排序

👀樊梓慕:个人主页 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》 🌝每一个不曾起舞的日子,都是对生命的辜负 目录 前言 1.冒泡排序 2.快速排序 2.1Hoare版 2.2占…

JavaEE-网络编程套接字(UDP/TCP)

下面写一个简单的UDP客户端服务器流程 思路: 对于服务器端:读取请求,并解析–> 根据解析出的请求,做出响应(这里是一个回显,)–>把响应写回客户端 对于客户端:从控制台读取用户输入的内容–>从控制…

Python数据容器——集合的相关操作

作者:Insist-- 个人主页:insist--个人主页 本文专栏:Python专栏 专栏介绍:本专栏为免费专栏,并且会持续更新python基础知识,欢迎各位订阅关注。 目录 一、理解集合 1. 集合是什么? 2. 为什么…

python 打包可执行文件-pyinstaller详解

python 打包可执行文件-pyinstaller详解 引言一、参数详解二、优化代码三、体积压缩 引言 pyinstaller是一个将python程序打包成独立可执行文件(exe,app等)的工具,它具有跨平台兼容性,可以在windows,mac和…