摘要:
1. MSE(均方误差损失) 优点: 1. 收敛快 缺点: 1. 假设了样本服从正态分布,如果训练样本label不服从正态分布,则MSE并非最大似然估计 2. 对异常点很敏感 2. MAE(平均绝对误差损失) 优点:不容易受异常值影响 缺点:收敛速度慢,拟合能力弱 3. Huber Loss 结合了 阅读全文
摘要:
双塔模型介绍 由于粗排的候选数目比精排多很多,粗排无法做的和精排一样复杂。现在业内比较通用的方案是采用双塔模型,左边塔建模user embedding,右边塔建模item embedding,由于用户的行为经常发生变化,user tower需要经常更新,但是item状态很少发生变化,可以离线算好所有 阅读全文
摘要:
张俊林:从对比学习视角,重新审视推荐系统的召回粗排模型 小红书高时效推荐系统背后的技术升级 https://github.com/Doragd/Algorithm-Practice-in-Industry 1.9万亿参数量,快手落地业界首个万亿参数推荐精排模型 https://zhuanlan.zh 阅读全文
摘要:
https://zhuanlan.zhihu.com/p/608636233 待整理 阅读全文
摘要:
https://zhuanlan.zhihu.com/p/560657191 待整理 阅读全文
摘要:
https://zhuanlan.zhihu.com/p/547087040 待整理 阅读全文
摘要:
背景 作者通过观察发现,用户的行为序列由多个session组成,session是根据时间划分出来的用户行为(比如说可以根据用户浏览时间划分session,若用户30分钟没有浏览记录时,下一次浏览即为一个新的session),观察发现a56爆大奖在线娱乐session内部用户行为是高度相似(同质)的,不同sessio 阅读全文
摘要:
背景 DIEN 通过引入GRU结构来建模用户的兴趣进化趋势 方法 整体结构 DIEN和常用模型的差异点在序列建模的部分,该部分结构由兴趣提取层和兴趣进化层两个部分组成: 兴趣提取层:从用户的行为序列中提取用户的兴趣序列 兴趣进化层:建模和target item相关的兴趣进化过程 兴趣提取层 兴趣进化 阅读全文