xd_xumaomao

2024年2月20日

摘要： 1. MSE（均方误差损失）优点： 1. 收敛快缺点： 1. 假设了样本服从正态分布，如果训练样本label不服从正态分布，则MSE并非最大似然估计 2. 对异常点很敏感 2. MAE（平均绝对误差损失）优点：不容易受异常值影响缺点：收敛速度慢，拟合能力弱 3. Huber Loss 结合了阅读全文

posted @ 2024-02-20 13:12 xd_xumaomao 阅读(262) 评论(0) 推荐(0) 编辑

2024年2月18日

粗排模型总结

摘要：双塔模型介绍由于粗排的候选数目比精排多很多，粗排无法做的和精排一样复杂。现在业内比较通用的方案是采用双塔模型，左边塔建模user embedding，右边塔建模item embedding，由于用户的行为经常发生变化，user tower需要经常更新，但是item状态很少发生变化，可以离线算好所有阅读全文

posted @ 2024-02-18 12:03 xd_xumaomao 阅读(115) 评论(0) 推荐(0) 编辑

2024年2月4日

搜广推技术分享

摘要：张俊林：从对比学习视角，重新审视推荐系统的召回粗排模型小红书高时效推荐系统背后的技术升级 https://github.com/Doragd/Algorithm-Practice-in-Industry 1.9万亿参数量，快手落地业界首个万亿参数推荐精排模型 https://zhuanlan.zh 阅读全文

posted @ 2024-02-04 11:48 xd_xumaomao 阅读(13) 评论(0) 推荐(0) 编辑

美团对偶双塔增强模型

摘要： https://zhuanlan.zhihu.com/p/608636233 待整理阅读全文

posted @ 2024-02-04 11:39 xd_xumaomao 阅读(45) 评论(0) 推荐(0) 编辑

美团超长序列建模论SDIM

摘要： https://zhuanlan.zhihu.com/p/560657191 待整理阅读全文

posted @ 2024-02-04 11:34 xd_xumaomao 阅读(12) 评论(0) 推荐(0) 编辑

阿里超长序列建模ETA

摘要： https://zhuanlan.zhihu.com/p/547087040 待整理阅读全文

posted @ 2024-02-04 11:29 xd_xumaomao 阅读(10) 评论(0) 推荐(0) 编辑

2024年1月29日

阿里序列建模论文BERT4Rec

摘要：背景利用BERT来做推荐模型结构模型训练阅读全文

posted @ 2024-01-29 16:44 xd_xumaomao 阅读(30) 评论(0) 推荐(0) 编辑

阿里超长序列建模论文MIMN

摘要：待补充 https://zhuanlan.zhihu.com/p/94177908/ 阅读全文

posted @ 2024-01-29 16:05 xd_xumaomao 阅读(10) 评论(0) 推荐(0) 编辑

2024年1月26日

阿里序列建模论文DSIN

摘要：背景作者通过观察发现，用户的行为序列由多个session组成，session是根据时间划分出来的用户行为（比如说可以根据用户浏览时间划分session，若用户30分钟没有浏览记录时，下一次浏览即为一个新的session），观察发现a56爆大奖在线娱乐session内部用户行为是高度相似(同质)的，不同sessio 阅读全文

posted @ 2024-01-26 16:43 xd_xumaomao 阅读(12) 评论(0) 推荐(0) 编辑

2024年1月24日

阿里序列建模论文DIEN

摘要：背景 DIEN 通过引入GRU结构来建模用户的兴趣进化趋势方法整体结构 DIEN和常用模型的差异点在序列建模的部分，该部分结构由兴趣提取层和兴趣进化层两个部分组成：兴趣提取层：从用户的行为序列中提取用户的兴趣序列兴趣进化层：建模和target item相关的兴趣进化过程兴趣提取层兴趣进化阅读全文

posted @ 2024-01-24 12:23 xd_xumaomao 阅读(15) 评论(0) 推荐(0) 编辑

公告