Slope one

✍ dations ◷ 2025-11-29 16:06:56 #Collaboration

Slope One 是一系列应用于协同过滤的算法的统称。由 Daniel Lemire和Anna Maclachlan于2005年发表的论文中提出。 有争议的是,该算法堪称基于项目评价的non-trivial 协同过滤算法最简洁的形式。该系列算法的简洁特性使它们的实现简单而高效,而且其精确度与其它复杂费时的算法相比也不相上下。 . 该系列算法也被用来改进其它算法。.

协同过滤推荐(Collaborative Filtering recommendation)在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 与传统文本过滤相比,协同过滤有下列优点:

尽管协同过滤技术在个性化推荐系统中获得了极大的成功,但随着站点结构、内容的复杂度和用户人数的不断增加,协同过滤技术的一些缺点逐渐暴露出来。 主要有以下三点:

当可以对一些项目评分的时候,比如人们可以对一些东西给出1到5星的评价的时候,协同过滤意图基于一个个体过去对某些项目的评分和(庞大的)由其他用户的评价构成的数据库,来预测该用户对未评价项目的评分。例如: 如果一个人给披头士的评分为5(总分5)的话,我们能否预测他对席琳狄翁新专辑的评分呢?

这种情形下, item-based 协同过滤系统根据其它项目的评分来预测某项目的分值,一般方法为 线性回归 ( f ( x ) = a x + b {\displaystyle f(x)=ax+b} 单位的存储空间,最多需要 2步. 计算量也有可能挺悲观的:假设用户已经评价了最多 个项目, 那么计算不超过2+2个项目间计算差值是可能的。 . 如果一个用户已经评价过“x”个项目,预测单一的项目评分需要“x”步,而对其所有未评分项目做出评分预测需要最多 () 步. 当一个用户已经评价过“x”个项目时,当该用户新增一个评价时,更新数据库需要 步.

可以通过分割数据(参照分割和稀疏存储(没有共同评价项目的用户可以被忽略))来降低存储要求,

相关

  • 碘酸钾碘酸钾,化学式KIO3,常被添加在食盐(氯化钠、NaCl)中,称为碘盐,用于补充碘成分,预防碘缺乏病。碘酸钾溶于水、稀硫酸,不溶于乙醇。溶于水呈无色。用过氧化氢和硝酸的混合溶液氧化碘得
  • 乙酸亚铁乙酸铁(II)或乙酸亚铁是一种白色或浅棕色固体离子化合物。它在水中的溶解度很高,可以形成浅绿色的四水合物。乙酸铁(II)的制备是通过铁屑和乙酸发生反应。一般用于在印染工业
  • 鞑靼语鞑靼语(鞑靼语:татарча)又称塔塔尔语,属于阿尔泰语系,是鞑靼斯坦地区使用的语言。鞑靼语本来用阿拉伯字母,斯大林时期改用西里尔字母,2001年鞑靼斯坦共和国政府决定改用土耳
  • 2004年10月逝世人物列表2004年逝世人物列表:1月 - 2月 - 3月 - 4月 - 5月 - 6月 - 7月 - 8月 - 9月 - 10月 - 11月 - 12月下面是2004年10月逝世的知名人士列表:
  • 吴英华吴英华(1907年-2003年),满族人,吴氏太极拳宗师吴鉴泉之长女,自幼从父学太极拳。16岁时应上海西门子公司总裁邀请,赴上海教拳,历任上海鉴泉太极拳社副社长、社长。致力于宏扬吴氏太极
  • 阿尔比斯山脉坐标:47°17′N 8°30′E / 47.283°N 8.500°E / 47.283; 8.500阿尔比斯山脉(Albisbergen),是瑞士的山脉,位于该国东北部,由苏黎世州负责管辖,全长19公里,最高点为海拔高度915米,每
  • 千层树千层树是生长在澳洲的一个植物属,目前已知有236种,其中230种原产于澳洲,其余生长在印度尼西亚、新几内亚、新喀里多尼亚和马来西亚,为桃金娘科植物。白千层属,又名千层树属。千层
  • 放屁的艺术《放屁的艺术》(法语:,另译《放屁,是有学问的》),是法国作家皮耶-托马-尼寇拉·余赫多在1751年以“皇家喇叭手”为匿名出版的一篇幽默伪科学论文。本书的副标题是:“专为正经严肃人
  • 大航海时代外传《大航海时代外传》(日语:大航海時代外伝)是一款由光荣制作和发行的模拟游戏。本游戏于1997年10月2日在PlayStation发行。游戏后在世嘉土星等平台发行。游戏的玩法基本与前作类
  • 森下站 (东京都)森下站(日语:森下駅/もりしたえき  */?)是位于日本东京都江东区森下,属于东京都交通局(都营地铁)的铁路车站。此站有新宿线与大江户线停靠。各自有车站编号,新宿线是S 11、大江户