首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于用户投票的排名算法(二):Reddit

上一次,我介绍了Hacker News的排名算法。它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。...Reddit是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反对"。用户点击进行投票,Reddit根据投票结果,计算出最新的"热点文章排行榜"。...至于2005年12月8日,应该是Reddit成立的时间。 (2)赞成票与反对票的差x   x = 赞成票 - 反对票 (3)投票方向y y是一个符号变量,表示对文章的总体看法。...(4)帖子的受肯定(否定)的程度z z表示赞成票与反对票之间差额的绝对值。如果对某个帖子的评价,越是一边倒,z就越大。如果赞成票等于反对票,z就等于1。...也就是说,前10个投票人与后90个投票人(乃至再后面900个投票人)的权重是一样的,即如果一个帖子特别受到欢迎,那么越到后面投赞成票,对得分越不会产生影响。

96560

基于用户投票的排名算法(三):Stack Overflow

上一篇文章,我介绍了Reddit的排名算法。 它的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。 但是,还有一些特定用途的网站,必须考虑更多的因素。...访问者可以对你的问题进行投票(赞成票或反对票),表示这个问题是不是有价值。 ? 一旦有人回答了你的问题,其他人也可以对这个回答投票(赞成票或反对票)。 ?...排名算法的作用是,找出某段时间内的热点问题,即哪些问题最被关注、得到了最多的讨论。 在Stack Overflow的页面上,每个问题前面有三个数字,分别表示问题的得分、回答的数目和该问题的浏览次数。...这一项的得分越高,就代表回答的质量越高。 但是我感觉,简单加总的设计还不够全面。这里有两个问题。...首先,一个正确的回答胜过一百个无用的回答,但是,简单加总会导致,1个得分为100的回答与100个得分为1的回答,总得分相同。其次,由于得分会出现负值,因此那些特别差的回答,会拉低正确回答的得分。

1.1K70
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    基于用户投票的排名算法(一):Delicious和Hacker News

    互联网的出现,意味着"信息大爆炸"。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。...排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位。 下面,我将整理和分析一些基于用户投票的排名算法,打算分成六个部分连载,今天是第一篇。...一、Delicious 最直觉、最简单的算法,莫过于按照单位时间内用户的投票数进行排名。得票最多的项目,自然就排在第一位。 旧版的Delicious,有一个"热门书签排行榜",就是这样统计出来的。...它的排名算法是这样实现的: 将上面的代码还原为数学公式: 其中,   P表示帖子的得票数,减去1是为了忽略发帖人的投票。   ...知道了算法的构成,就可以调整参数的值,以适用你自己的应用程序。

    1.1K80

    Delicious和Hacker News--基于用户投票的排名算法

    用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 各种各样的排名算法,是目前过滤信息的主要手段之一。...排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位。 ? 下面,我将整理和分析一些基于用户投票的排名算法,打算分成六个部分连载,今天是第一篇。...一、Delicious 最直觉、最简单的算法,莫过于按照单位时间内用户的投票数进行排名。得票最多的项目,自然就排在第一位。旧版的Delicious,有一个”热门书签排行榜”,就是这样统计出来的。 ?...其中,P表示帖子的得票数,减去1是为了忽略发帖人的投票。...或者说,一个帖子的排名,会随着时间不断下降。从前一张图可以看到,经过24小时之后,所有帖子的得分基本上都小于1,这意味着它们都将跌到排行榜的末尾,保证了排名前列的都将是较新的内容。

    80650

    基于加权投票的尖峰神经活动数据高效解码

    图1.整个解码通道使用左侧的滑动窗口、中间的分类器和右侧的投票层计算尖峰信号 研究人员使用了两种常用的分类器:KNN 解码器(无模型)和泊松解码器(基于模型)。...在平局的情况下,最近邻的投票被用作决胜局。...(b) 整个实验在不投票(滑动窗口)、累积窗口和基于投票(具有基于准确性的权重)中的准确性。 (c) 所有记录会话中 a 和 b 部分显示的所有曲线的平均精度箱形图 图 5....(a) 不同投票权重集的响应阶段的准确性。 (b) 响应阶段在不投票(滑动窗口)、累积窗口和基于投票(具有基于准确性的权重)中的准确性。...通过结合时间历史(基于投票的滑动窗口和累积窗口方法),而不是独立分析每个时间窗口,展示了预测准确性的显着提高。

    52410

    基于投票方式的机器人装配姿态估计

    摘要:本文提出了一种基于投票的适用于三维传感器的位姿估计算法,能够快速代替机器人行业、计算机视觉和游戏应用程序中二维相应的算法。...图1 如上图左边所示,展示了捡箱系统的设置。本系统使用一个附在六轴工业机器人手臂上的3D传感器来估计随机放置在箱子里的物体的姿态。3D传感器是基于结构光使用红外激光,并提供三维数据作为像素的深度图。...右图为算法流程图,本系统使用3D传感器扫描对象的箱子,给定目标物体的三维CAD模型,使用基于投票的算来扫描三维点云对目标物体进行检测和姿态估计,这提供了多个粗的位姿假设。...改进后的配准误差由对应场景与模型点之间的平均距离给出,当投票算法计算出的粗位姿不正确,或者由于被其他物体遮挡而丢失部分物体时,配准误差会很大。...C.投票机制 在计算点对特征并构造哈希表结构的基础上,通过计算场景对特征与一组对应的模型对特征之间的刚体变换,找到提出假设,为了提高搜索效率,本文采用了投票方案,利用局部坐标将投票空间缩减为2D空间。

    67610

    赵曙光:专车有市场是用户“用脚投票”的结果

    与广东作为改革开发前沿地区的经验类似,中国互联网的快速发展很大程度上也得益于政府顺应“用脚投票”的结果,尽量减少对互联网领域的限制、干预,重视为互联网行业的发展创造公平竞争的环境。...当然,创新的破坏性效果有影响,很大程度上是用户用脚投票的结果。...对2944名使用过专车服务的用户调查数据则显示,问及用户为什么选择乘坐专车,61.6%的用户选择了服务质量高,36.8%的用户选择了可选择车型多,而这些都是优质服务的重要组成部分。...基于对未来利益的担心与恐惧更具有游说政府部门进行市场管制的动机。 从管制的角度来说,即便政府要对打车软件进行监管也需要慎重考虑管制的方式选择。...“互联网+”的发展需要给公众用脚投票更多的机会,促进市场创新,发挥技术升级与政策促进的良性互动作用。

    77560

    如何检查列表中的某个帖子是否被当前用户投票

    在 Django 项目中,如果需要检查一个列表中的某个帖子是否被当前用户投票(比如点赞或踩),可以通过数据库查询实现。...以下是具体的实现方法,假设你使用的是 Django 并有如下的数据库模型结构:问题背景我正在创建一个reddit克隆,其中存在一个问题,我正在寻找一种方法来指示当前用户是否对某个特定问题进行过投票,而不会产生过多数据库请求...endrecursetree %} {% endblock content %}解决方案对于这种问题,通常有两种解决方案:1、通过模型方法首先,我们需要在模型中添加两个方法,用来检查用户是否对某个节点进行过投票...downvoted_by(self, user): return self.down_votes.filter(user=user).exists()然后,在视图中,我们可以使用这些方法来检查用户是否对某个帖子进行过投票...down="{%if node.pk in downvoted_comments %}{% endif %}"​ ...​通过上述方法,可以高效地检查列表中每个帖子是否被当前用户投票

    4200

    基于图卷积注意网络的药物相似性预测

    陈兴民 编辑 | 龙文韬 论文题目 Prediction of Drug-likeness using Graph Convolutional Attention Network 论文摘要 动机: 药物相似性已被广泛用作区分类药分子与非药物分子的标准...开发可靠的计算方法来预测药物相似的化合物对筛选无用的分子和加速药物发现过程至关重要。结果:该研究建立了一种基于图卷积注意网络(D-GCAN)的深度学习方法,直接从分子结构预测药物相似性。...结果表明,D-GCAN模型在药物相似预测方面优于其他最先进的模型。图卷积和注意力机制的结合对模型的性能做出了重要贡献。具体而言,注意力机制的应用使准确率提高了4.0%。...筛选出65种候选药物,其中大多数亚结构与现有口服药物的亚结构相似。从S-GDB13筛选的候选药物与现有药物的相似度更高,分子对接性能优于从其余GDB-13筛选的候选药物。...总的来说,D-GCAN是一种很有前景的预测药物相似度的工具,用于选择潜在的候选药物,并通过排除无前景的候选药物和避免不必要的生物和临床试验来加速药物的发现。

    42930

    基于文档相似性度量的招标文档查重系统

    由于对方部署电脑性能较差,没有GPU,只能用一些CPU能跑的文本相似性度量算法来实现。...二、用户操作 三、进行招标文件目录的加载 (1)选择好目录,拷贝地址到目录栏中。注意:文件目录给定的方案进行存储,每个文件中有3个WORD等(人员、经费、标书)。 (2)点击“开始加载”按钮。...这时候,可以在后台看到加载的步骤: (3)加载完成后,会将各个招标公司的信息进行呈现,如下图所示。 每个公司对应都呈现三大块内容,如下图所示。...四、进行招标文件检测报告查看 (1)点击左侧的查重报告,经过加载,可以呈现如下图所示的页面。 对每个招标公司而言,要和其他公司进行两两检测。...五、系统功能介绍 简单的一个页面呈现,供了解系统的功能和框架。

    2.6K20

    Physica A 2020 | 链接预测综述(一):基于相似性的方法

    除了基于聚类和信息论的模型之外,本篇综述还将介绍基于学习的方法。本文还对相似性和其他一些有代表性的方法的实验结果进行了列表和讨论。...2.1 基于相似性的方法 基于相似性的方法是链接预测中最简单的一种方法。对于每一对节点 图片 ,我们可以计算它们之间的相似性得分 图片 。...针对 图片 ,我们可以算出对应节点对之间的相似性得分,如果得分较高,则说明它们间有链接。 每一对节点之间的相似性可以使用网络的某些属性来计算,其中最主要的是结构属性。...转移矩阵 图片 定义如下: 此时概率可以简化为: 由于这种相似性是不对称的,因此节点对(x, y)之间的最终相似性得分可以计算为: 图片 (3)Shortest Path 定义如下: 图片...此外,还有LHNG、 、ACT、NACT、MF等全局相似性指标,这里不再具体阐述了,需要了再看。 准局部相似性指数 准局部指数是作为局部和全局方法性能和复杂性之间的权衡而引入的。

    1K20

    序列的相似性

    序列的相似性可以是定量的数值,也可以是定性的描述。相似度是一个数值,反映两条序列的相似程度。关于两条序列之间的关系,有许多名词,如相同、相似、同源、同功、直向同源、共生同源等。...但也有例外,即两条序列的相似性很高,但它们可能并不是同源序列,这两条序列的相似性可能是由随机因素所产生的,这在进化上称为“趋同”(convergence),这样一对序列可称为同功序列。...序列的比对是一种关于序列相似性的定性描述,它反映在什么部位两条序列相似,在什么部位两条序列存在差别。最优比对揭示两条序列的最大相似程度,指出序列之间的根本差异。...基于滑动窗口的点矩阵方法可以明显地降低点阵图的噪声,并且可以明确地指出两条序列间具有显著相似性的区域。...PAM矩阵是第一个广泛使用的最优矩阵,它是基于进化原理的,建立在进化的点接受突变模型PAM(Point Accepted Mutation)基础上,通过统计相似序列比对中的各种氨基酸替换发生率而得到该矩阵

    10510

    1934: Vote 善意的投票

    1934: [Shoi2007]Vote 善意的投票 Time Limit: 1 Sec  Memory Limit: 64 MB Submit: 1174  Solved: 723 [Submit][...Status] Description 幼儿园里有n个小朋友打算通过投票来决定睡不睡午觉。...虽然每个人都有自己的主见,但是为了照顾一下自己朋友的想法,他们也可以投和自己本来意愿相反的票。我们定义一次投票的冲突数为好朋友之间发生冲突的总数加上和所有和自己本来意愿发生冲突的人数。...我们的问题就是,每位小朋友应该怎样投票,才能使冲突数最小? Input 第一行只有两个整数n,m,保证有2≤n≤300,1≤m≤n(n-1)/2。其中n代表总人数,m代表好朋友的对数。...,0的与汇点相连,小朋友之间为朋友的连边,所有边权为1,直接一边sap搞定(PS:网络流题目注意边的方向,切忌把方向弄反!!!)

    67970

    内容运营连接用户和产品之间的纽带!

    内容运营连接用户和产品之间的一种主要表现方式,是整个运营中非常重要的一部分。这几年互联网里面也开始推崇一种“内容为王”的说法。...而其最关键的一点就是:如何围绕着用户的需求,创造出内容的价值。 如何围绕用户的需求,我们需要牢记用户的四步法:(拉新)用户为什么会来?(留存)为什么会留下?(促活)为什么会活跃?(转换)为什么会转化?...我们应“站在用户的角度去思考”,他们会去遇到什么问题。 比如做母婴的,用户就一定是妈妈群体偏多,那一定是一些育儿方面的问题,这个容易理解。比如是做校园贷的,那用户就是大学生。...,能够快速的吸引用户的注意,抓住用户的东西。...4、感受 用户在内容获取之后的感受,这一点经常会被忽略,但其实这一点非常非常重要。因为用户的感受决定了用户的扩散的动力。

    1.7K50

    探秘Oracle表空间、用户、表之间的关系

    ,并没有仔细思考总结,后面再次用到oracle时,不能再那么糊里糊涂的用了,得稍微探索一下下了,究竟这些oracle中的数据库对象之间都存在什么关系呢?   ...,一个用户可以管理多个数据库;而连接oracle中的字符串主要是用户名+密码来标识数据库,即一个用户管理一个方案(方案就是某用户拥有的所有的数据库对象的逻辑集合,可以看做是SQL Server或MySQL...Oracle中建立表空间、用户、表 ----   下面通过一个在oracle中建立方案的例子来说明oracle中表空间、用户、表之间的关系。   ...(4)为用户授权   刚才建立的用户,只是个空壳,神马权限都没有。   如果不为其分配connect的权限,则连登录都会被拒绝: ?   ...您说是吧 ~_~ 嘿嘿 ~_~ ---- 【 转载请注明出处——胡玉洋《探秘Oracle中表空间、用户、表之间的关系》】

    2.6K20

    摩尔投票的原理详解

    摩尔投票算法介绍 摩尔投票算法(Boyer-Moore Majority Vote Algorithm)是一种用于查找数组中出现次数超过一半的主要元素的高效算法。...它的核心思想是通过消除不同的元素对来找到主要元素,这个算法的时间复杂度为 O(n),其中 n 是数组的长度。...摩尔投票算法适用于大多数寻找主要元素的问题,例如,查找出现次数超过一半的元素,查找众数等。它是一个高效的算法,通常用于解决此类问题。...这就是摩尔投票算法的工作原理,通过不断消除不同的元素对,最终找到了主要元素。在这个示例中,主要元素是 2。算法只需要进行一次遍历,具有高效的时间复杂度。...摩尔投票算法,解决的问题是如何在任意多的候选人中,选出票数超过一半的那个人。假设投票是这样的,[A, C, A, A, B],ABC 是指三个候选人。

    56610

    并发用户数与TPS之间的关系

    背景 在做性能测试的时候,很多人都用并发用户数来衡量系统的性能,觉得系统能支撑的并发用户数越多,系统的性能就越好;对TPS不是非常理解,也根本不知道它们之间的关系,因此非常有必要进行解释。 2....术语定义 Ø 并发用户数:指的是现实系统中操作业务的用户,在性能测试工具中,一般称为虚拟用户数(Virutal User),注意并发用户数跟注册用户数、在线用户数有很大差别的,并发用户数一定会对服务器产生压力的...,将思考时间(思考时间的值等于交易响应时间)加到脚本中,并发用户数基本可以增加一倍,因此用并发用户数来衡量系统的性能没太大的意义。...性能测试策略 做性能测试需要一套标准化流程及测试策略,并发用户数只是指标考虑的一个,在做负载测试的时候,一般都是按照梯度施压的方式去加用户数,而不是在没有预估的情况下,一次加几万个用户,,交易失败率非常高...总结 Ø 系统的性能由TPS决定,跟并发用户数没有多大关系。在同样的TPS下,可以由不同的用户数去压(通过加思考时间设置)。

    2.7K10
    领券