Slope one

✍ dations ◷ 2025-06-13 22:37:17 #Collaboration

Slope One 是一系列应用于协同过滤的算法的统称。由 Daniel Lemire和Anna Maclachlan于2005年发表的论文中提出。 有争议的是,该算法堪称基于项目评价的non-trivial 协同过滤算法最简洁的形式。该系列算法的简洁特性使它们的实现简单而高效,而且其精确度与其它复杂费时的算法相比也不相上下。 . 该系列算法也被用来改进其它算法。.

协同过滤推荐(Collaborative Filtering recommendation)在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 与传统文本过滤相比,协同过滤有下列优点:

尽管协同过滤技术在个性化推荐系统中获得了极大的成功,但随着站点结构、内容的复杂度和用户人数的不断增加,协同过滤技术的一些缺点逐渐暴露出来。 主要有以下三点:

当可以对一些项目评分的时候,比如人们可以对一些东西给出1到5星的评价的时候,协同过滤意图基于一个个体过去对某些项目的评分和(庞大的)由其他用户的评价构成的数据库,来预测该用户对未评价项目的评分。例如: 如果一个人给披头士的评分为5(总分5)的话,我们能否预测他对席琳狄翁新专辑的评分呢?

这种情形下, item-based 协同过滤系统根据其它项目的评分来预测某项目的分值,一般方法为 线性回归 ( f ( x ) = a x + b {\displaystyle f(x)=ax+b} 单位的存储空间,最多需要 2步. 计算量也有可能挺悲观的:假设用户已经评价了最多 个项目, 那么计算不超过2+2个项目间计算差值是可能的。 . 如果一个用户已经评价过“x”个项目,预测单一的项目评分需要“x”步,而对其所有未评分项目做出评分预测需要最多 () 步. 当一个用户已经评价过“x”个项目时,当该用户新增一个评价时,更新数据库需要 步.

可以通过分割数据(参照分割和稀疏存储(没有共同评价项目的用户可以被忽略))来降低存储要求,

相关

  • 巴黎凯旋门巴黎凯旋门(法语:Arc de triomphe de l'Étoile),即雄狮凯旋门,位于法国巴黎的戴高乐广场中央,香榭丽舍大街的西端。是拿破仑为纪念1805年打败俄奥联军的胜利,于1806年下令修建而成
  • 国防军陆军总司令部陆军总司令部(德语:Oberkommando des Heeres,通称“OKH”)是1936年至1945年德意志国防军陆军部队的最高指挥机构,在理论上受“国防军总司令部”的指挥。但实际上在1941年后,“国防
  • 大吉隆坡大吉隆坡,为马来西亚最大的都会区,其面积涵盖了除沙白安南县、瓜雪县、乌雪县和瓜冷县以外的整个雪兰莪州、吉隆坡和布城。虽然大吉隆坡和“巴生谷”相似,但两者之间还是有所差
  • 赛巴斯提阿诺·维涅尔赛巴斯提阿诺·维涅尔(意大利语:Sebastiano Venier,1496年-1578年3月3日),也被他人称作维涅罗(Veniero),是一名意大利政治家和军事家。他曾于1577年6月11日至1578年3月3日担任威尼斯
  • 卓娅·布尔加科娃卓娅·费多罗韦娅-布尔加科娃(俄语:Зоя Фёдоровна Булгакова;1914年12月24日-2017年2月3日)是一个苏联舞台剧演员,俄罗斯联邦政府荣誉艺术家(1945年)。在她去
  • 李飚李飚(1971年12月-),四川成都人,汉族,中国共产党党员。中华人民共和国政治人物、第十三届全国人民代表大会四川地区代表。2018年,被选为全国人大代表。
  • なめこ印なめこ印,是日本轻小说作家。
  • 孔洙孔洙(1228年-1287年),字思鲁,号存斋。宋朝时衢州人,祖籍曲阜。孔子五十三代孙,孔玠玄孙,孔搢曾孙,孔文远之孙,孔万春之子。淳祐元年(1241年)宋理宗授他为承奉郎,袭封衍圣公。宋度宗咸淳二
  • 啊,野麦峠啊,野麦岭(ああのむぎとうげ)是山本茂实1968年发表的小说。初版在朝日新闻。1972年再版。明治初期到大正,昭和年间,飞騨贫苦农村的妇女(多数为10多岁的少女)越过野麦岭前往诹访郡冈
  • 戈麦斯安德烈斯·戈麦斯·桑托斯(西班牙语:Andrés Gómez Santos,1960年2月27日-),生于厄瓜多尔瓜亚基尔,已退役的厄瓜多尔男子网球运动员,网球史上最佳南美洲选手之一,厄瓜多尔至今唯一一