文章目录
- 用户行为序列建模
- Din模型
- Din模型的缺点
用户行为序列建模
物品ID通过Embedding将会得到一个向量,性质差不多的向量在空间中也会处于差不多的位置,可以用取平均方式得到一个综合所有向量的向量。
取平均后可以作为代表用户的一个特征。
以上的LastN是指用户最后点击的N个商品,采用LastN可以将用户最后点击的N个商品综合起来。
Din模型
所谓的LastN是一种普通版本的平均,他考虑到了每一个物品,但并未考虑到每一个物品所占的重量。
而这个所占的重量/占比,是需要和要查询的候选向量进行比较来得出,也就是所谓的相似度,相似度越大,受其影响也会越大。
Din模型的缺点
DIN模型只根据过往N个物品进行计算,也就是说过往N个物品之前的物品就没有纳入到计算之中,也就是说会遗忘过往计算出来的特征。
由于序列过大会造成运算次数的增加,而固执地采用后N个则会无法保持长期兴趣的数据,所以可以在保证序列长度固定的前提下,对N个挑选出来的对象进行操作。
d i d_i di表示第i个物品的时间戳。
时间越久远,说明这个兴趣是越找之前,但仍有意义。
使用Soft search还是hard search主要看的是公司的基础建设支持哪一种,且hard search写起来会相对容易。