Slope one

✍ dations ◷ 2025-08-16 11:36:44 #Collaboration

Slope One 是一系列应用于协同过滤的算法的统称。由 Daniel Lemire和Anna Maclachlan于2005年发表的论文中提出。 有争议的是,该算法堪称基于项目评价的non-trivial 协同过滤算法最简洁的形式。该系列算法的简洁特性使它们的实现简单而高效,而且其精确度与其它复杂费时的算法相比也不相上下。 . 该系列算法也被用来改进其它算法。.

协同过滤推荐(Collaborative Filtering recommendation)在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 与传统文本过滤相比,协同过滤有下列优点:

尽管协同过滤技术在个性化推荐系统中获得了极大的成功,但随着站点结构、内容的复杂度和用户人数的不断增加,协同过滤技术的一些缺点逐渐暴露出来。 主要有以下三点:

当可以对一些项目评分的时候,比如人们可以对一些东西给出1到5星的评价的时候,协同过滤意图基于一个个体过去对某些项目的评分和(庞大的)由其他用户的评价构成的数据库,来预测该用户对未评价项目的评分。例如: 如果一个人给披头士的评分为5(总分5)的话,我们能否预测他对席琳狄翁新专辑的评分呢?

这种情形下, item-based 协同过滤系统根据其它项目的评分来预测某项目的分值,一般方法为 线性回归 ( f ( x ) = a x + b {\displaystyle f(x)=ax+b} 单位的存储空间,最多需要 2步. 计算量也有可能挺悲观的:假设用户已经评价了最多 个项目, 那么计算不超过2+2个项目间计算差值是可能的。 . 如果一个用户已经评价过“x”个项目,预测单一的项目评分需要“x”步,而对其所有未评分项目做出评分预测需要最多 () 步. 当一个用户已经评价过“x”个项目时,当该用户新增一个评价时,更新数据库需要 步.

可以通过分割数据(参照分割和稀疏存储(没有共同评价项目的用户可以被忽略))来降低存储要求,

相关

  • 咳嗽咳嗽是一种呼吸道常见的突发性症状,咳嗽由气管、支气管粘膜或胸膜受炎症、异物、物理或化学性刺激引起,咳嗽时先是声门关闭,呼吸肌收缩,肺内压升高,然后声门张开,肺内空气喷射而出
  • 芦竹碱芦竹碱(英语:gramine)又名禾草碱,是一种吲哚族生物碱,有毒。
  • ATC代码 (J06)A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码J06(免疫血清和免疫球蛋白)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WH
  • 秩序之主 (漫威宇宙)秩序之主(英语:Master Order)是漫威漫画的一位神祇,是宇宙稳定秩序的化身。和混乱之主对立平衡,两个一起创造了In-Betweener,让他维持宇宙的平衡。是颗大头。在吞星者被转化成生命
  • 严树森严树森(?-1876年4月9日),字渭春,四川新繁人。清朝政治人物。原籍陕西渭南。道光二十年(1840年)举人,捐内阁中书。改知县,铨授湖北东湖县,再升同知。晋升为知府,后署武昌府。善诗文,工书法
  • 李增荣李增荣(1866年-?年),字?,四川省绵州直隶州绵竹县人,光绪二十九年(1903年)癸卯补行辛丑壬寅恩正并科进士,官山西省偏关县、崞县、临汾县知县。
  • 彰化八景彰化八景,指的是彰化县的八大景色,但随着时代更迭,部分景色变迁而有所变异。又由于清朝时的彰化县范围包含今日之彰化、南投、云林,故部分景点现已不在现今的彰化县境内。雍正年
  • 德米特里·丹尼洛维奇·列柳申科德米特里·丹尼洛维奇·列柳申科(俄语:Дми́трий Дани́лович Лелюше́нко,1901年10月20日(11月2日)-1987年7月20日),苏联大将,战时近卫坦克第四集团军司令
  • 夺魂使者《夺魂使者》(英语:)是维维安·席林编剧、迈克尔·里西执导的1990年美国奇幻恐怖片,乔·艾斯特维兹扮演电影同名主角,其他演员包括维维安·席林、格雷格·汤姆森、查克·威廉姆斯
  • GE~Good Ending~《GE~Good Ending~》是由流石景所创作,关于校园恋爱的日本漫画作品。《周刊少年Magazine》(讲谈社)2009年19号刊载,于同年38号正式开始连载。台版译名为《~GE~恋爱成就》,由东立出版社