资源预览内容
第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
今日头条推荐算法2024推荐系统推荐系统19444人在进行视频或语音聊天62.5万部优酷土豆视频被观看 Facebook共产生701,389账号登陆 App Store上已有51,000个app被下载。推荐系统推荐系统推荐系统协同过滤如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?如何确定一个用户是不是和你有相似的品位?如何将邻居们的喜好组织成一个排序的目录?协同过滤要实现协同过滤,需要的步骤?1. 收集用户偏好2. 找到相似的用户或物品3. 计算推荐协同过滤相似度计算相似度计算欧几里德距离(Euclidean Distance)皮尔逊相关系数(Pearson Correlation Coefficient)Cosine 相似度(Cosine Similarity)相似度计算皮尔逊相关系数(Pearson Correlation Coefficient)协方差皮尔逊相关系数Pearson相关系数是用协方差除以两个变量的标准差得到的相似度计算皮尔逊相关系数相似度计算邻居的选择A. 固定数量的邻居B. 基于相似度门槛的邻居协同过滤基于用户的协同过滤协同过滤基于用户的协同过滤要解决的问题已知用户评分矩阵Matrix R(一般都是非常稀疏的)推断矩阵中空格empty cells处的值协同过滤UserCF存在的问题issues对于一个新用户,很难找到邻居用户。对于一个物品,所有最近的邻居都在其上没有多少打分。协同过滤基础解决方案相似度计算最好使用皮尔逊相似度考虑共同打分物品的数目,如乘上min(n,N)/Nn:共同打分数 N:指定阈值对打分进行归一化处理设置一个相似度阈值相似度计算基于用户的协同过滤为啥不流行?1. 稀疏问题2. 数百万的用户计算,这量?3. 人是善变的协同过滤基于物品的协同过滤协同过滤基于物品的协同过滤优势!计算性能高,通常用户数量远大于物品数量可预先计算保留,物品并不善变协同过滤r_51 = (0.41*2 + 0.59*3)/(0.41 + 0.59) = 2.6协同过滤用户冷启动问题引导用户把自己的一些属性表达出来利用现有的开放数据平台根据用户注册属性推荐排行榜单协同过滤物品冷启动问题文本分析主题模型打标签推荐排行榜单协同过滤协同过滤基于用户的推荐基于物品的推荐实时新闻 图书突然情况 电子商务电影。隐语义模型隐语义模型从数据出发,进行个性化推荐用户和物品之间有着隐含的联系隐含因子让计算机能理解就好将用户和物品通过中介隐含因子联系起来隐语义模型隐语义模型 分解 组合隐语义模型隐语义模型隐语义模型隐语义模型求解梯度下降方向:迭代求解:隐语义模型隐语义模型负样本选择对每个用户,要保证正负样本的平衡(数目相似)选取那些很热门,而用户却没有行为的物品对于用户物品集K (u,i)其中如果(u, i)是正样本,则有 𝑟 𝑢𝑖 = 1,负样本则𝑟 𝑢𝑖 = 0隐语义模型隐语义模型参数选择隐特征的个数F,通常F=100学习速率alpha,别太大正则化参数lambda,别太大负样本/正样本比例 ratio隐语义模型协同过滤VS隐语义原理:协同过滤基于统计,隐语义基于建模空间复杂度,隐语义模型较小实时推荐依旧难,目前离线计算多隐语义模型咋解释呢?不解释评估指标评估标准:准确度:召回率:令R(u)是根据用户在训练集上的行为给用户作出的推荐列表, T(u)是用户在测试集上的行为列表评估指标评估标准:覆盖率: 多样性:推荐系统推荐系统
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号