首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【精选好文】Reddit如何统计每个帖子的浏览量

所以我们想要建立一个能够计算一个帖子浏览数的系统。这一数字会被展示给帖子的创作者和版主,以便他们更好的了解某个帖子的活跃程度。 在这篇博客中,我们将讨论我们是如何实现超大数据量的计数。...想要知道这个信息,我们就要为每篇帖子维护一个访问用户的集合,然后在每次计算浏览量时检查集合。...如果我们需要存储 100 万个独立访客的 ID, 每个用户 ID 8 字节长,那么为了存储一篇帖子的独立访客我们就需要 8 M的内存。反之,如果采用 HLL 会显著减少内存占用。...这通常会发生在网友访问较老帖子的时候,这时该帖子的计数器很可能已经在 Redis 中过期了。 为了存储存在 Redis 中的计数器过期的老帖子的浏览量。...总  结 我们希望浏览量可以让发帖者了解帖子全部的访问量,也帮助版主快速定位自己社区中高访问量的帖子。在未来,我们计划利用我们数据管道在实时方面的潜力来为 Reddit 的用户提供更多的有用的反馈。

1.4K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    New in 12.2- 让每个PDB都拥有自己的 local undo表空间

    12.1引入temp undo概念 ,12.2引入local undo,也就是每个pdb拥有自己的undo表空间(以前版本共用一个undo表空间),rac中每个pdb每个实例都有自己的undo。...使用local undo的益处 1、隔离后,减少undo表空间的争用,同时方便拔插 2、flashback a PDB 3、point-in-time recovery PDB 4、relocating...打开loacl undo后,自动为当前的PDB创建undo表空间,同时新创建pdb,自动创建自己的undo表空间 ?...可以通过配置pdb$seed的undo,从而使根据seed模板创建的pdb后undo表空间的名字、大小等: ? 修改undo表空间 ? 连接到CDB root ?...或者是直接在pdb$seed中删除undotbs1,之后创建的pdb都只有SEEDUNDOTS1表空间: ? 创建PDB数据库pdb4 ? 连接到pdb4 ?

    1.3K50

    03 | 密码学基础:如何让你的密码变得“不可见”?

    在这些场景中,多方交互都通过一个共同的通道来进行,那我们该如何保障其中内容的 CIA 呢?这就需要用到各种加密技术了。今天,我们就一起来学习密码学相关的知识。 首先,我先来普及一个语文知识。...因此,很多人都相信,这个 S 盒中存在后门,只要美国政府需要,就能够解密任何 DES 密文。...相比于 DES 和 AES 的使用受到美国政府的控制,IDEA 的设计人员并没有对其设置太多的限制,这让 IDEA 在全世界范围内得到了广泛地使用和研究。...我们知道,密码学作为安全的基础学科,如果全部依靠国外的技术,对于国家安全可能产生不利影响。因此,中国政府提出了一系列加密算法。其中,国密算法 SM1 和 SM4 都属于对称加密的范畴。...接下来,我们来看一看它们是如何应用的。 在加密通信中(如 HTTPS、VPN、SSH 等),通信双方会协商出一个加密算法和密钥,对传输的数据进行加密,从而防止第三方窃取。

    92810

    怎样提高博客的页面访问量

    看到别人翻译的一篇文章,是讨论如何提高博客访问量的,提到的有几个方法蛮有新意,不过不赞成原文的“在聚合中只输出摘要”的方法。...十四个方法提高博客的页面访问量 作者:Darren Rowse,翻译:Lucifer   如何增加Blog的访问量已经是老生长谈了,其实对于blogger来说另一个统计数也至关重要:页面浏览量。...对不同blog来说,每个访问者的页面浏览量会有所不同,但希望这个数字可以大一总不是件坏事: 回头率: 读者浏览的页面越多,那么他再次造访的可能性也就更大。...很多的blogger在自己的blog上会多次写到同一主题,把这些文章都链到一起无疑会显出你对这个主题的探讨深度。...所以我看到只输出摘要的blog就一个反应,把它从我的bloglines里删除。强烈建议所有的blogger都在聚合里都输出完整的文章!

    77800

    让各大企业都头疼的DDoS攻击,应该如何防范?

    那第二也有可能就是说其他这个开面馆的,还有开餐饮的嫉妒这个老李的面馆就是生意非常火爆,那这样的话他就买凶骚扰,来去让他这个面馆逐渐的生意,慢慢的就黄掉了。...根据这几张图我们总结来说就是,攻击者通过控制分布在各地的大量的肉鸡或者是僵尸网络,同时向目标发起大量的恶意报文,用来阻塞被打击目标的这个出口带宽,或者是消耗这个目标服务器的这个CPU计算资源,最终使得被打击的目标服务瘫痪...那随着我们互联网行业的发展,DDoS攻击也是越发猖獗,给各行各业都带来一个极大的困扰。像知名的游戏公司暴雪就经常遭受DDoS攻击,游戏玩家掉服。...是因为现在我们网络上DDoS攻击的成本是在不断下降的,随着每一年成本的下降,它攻击的次数和峰值也在迅速上升。...温馨提示:本期直播课中结合了行业案例,重点介绍了腾讯DDoS安全防护系统如何防范大流量攻击,建议感兴趣的同学观看完整课程视频进行学习,点击文末“阅读原文”即可跳转观看噢~ 腾讯云大学公众号 长按识别二维码关注

    35050

    乐享论坛全面升级,强化运营管理!

    你发一条帖子,我发一条帖子,有人点赞,有人回帖,热门的帖子话题大家就热闹一番,大多数帖子都凉如水,难道乐享的论坛发明了更好的玩法?     必须的!看看成都宜家是怎么玩的?...每个同事都有各自的爱好,如何帮助他们快速找到志同道合者,共同组织活动?...那么如何做到?这一次,很简单,因为—— 乐享论坛全面升级、强化内容运营管理,让论坛管理更简单、让用户分享更快乐!...1 帖子推荐置顶:热帖快速上头条     发现好的、优秀的、高质量的帖子,如果只是点个赞、留个言,那会让你看起来像个“吃瓜群众”,作为乐享管理员,乐享首席内容运营官,让它上“头条”,向全体同事推荐,那才是正常发挥...那些浏览量、回复量高的帖子,就是热帖、好贴的标志,代表了同事们的关心热点。怎么样才能做到及时发现热帖、好贴,不会漏掉呢?乐享论坛的舆情监控来了!

    1.3K10

    马斯克:不想当网红的富翁不是天才老板

    Platformer证实到,在马斯克威胁要解雇剩下的工程师后,他们建立了一个系统,旨在确保只有马斯克的推文能够脱颖而出。 如何拯救一名过气“网红” 到周一下午,“问题”似乎已经被“解决”。...但是,排名算法根据数百或数千种信号进行预测,并向数以百万计的用户提供帖子,这使得任何人都几乎不可能准确地说出谁看到了什么。 不管是好是坏,唯一可以确定的是,当下的这种算法对马斯克来说还不够好。...毕竟作为拥有近1.29亿粉丝的推特最著名用户,他的帖子经常获得1000万或更多浏览量。但马斯克的浏览量仍然波动很大。...但你也可以改变排名算法,让推特始终推荐你的推文,就像马斯克现在在做的这样。...我认为,我们已经过了相信他真的想为这里的每个人做最好的事情的时候了。”

    51510

    Sticky Posts Switch插件教程WordPress中为分类添加置顶文章

    在本文中,我们晓得博客将向您展示如何在WordPress中为类别添加置顶文章。 注意:Sticky Post仅适用于内置帖子类型帖子,不适用于自定义帖子类型。  ...它将最重要的文章,即您希望读者阅读的文章放在博客的顶部。  展示它们的最佳方式是作为帖子,但它们所持有的信息不是时间敏感的。无论何时发布,您都希望它们处于开头。...这样做将提高他们的知名度和点击率 CTR。  这样人们可以更轻松地找到您的支柱帖子并帮助他们获得更多的综合浏览量。它还有助于让用户在您的网站上花费更多时间并提高参与度。...Sticky Posts Switch插件教程WordPress中为分类添加置顶文章 Sticky Posts Switch插件的特点使您可以对首页、存档页面或类别页面上的每个自定义帖子类型使用粘性帖子功能对自定义帖子类型的快速和批量编辑支持选择帖子类型...请注意,星形图标仅在管理仪表板中可见,现在已经为WordPress中的类别添加了置顶文章。

    5.6K20

    Reddit 如何实现大规模的帖子浏览计数

    然后将该数量展示给内容创建者和版主,以便他们更好地了解特定帖子上的活动。 在这篇文章中,我们将讨论我们如何大规模地实现计数。 计数方法 对浏览计数有四个主要要求: ◈ 计数必须是实时的或接近实时的。...为了实时保持准确的计数,我们需要知道某个特定的用户是否曾经访问过这个帖子。要知道这些信息,我们需要存储先前访问过每个帖子的用户组,然后在每次处理对该帖子的新访问时查看该组。...这个解决方案的一个原始实现是将这个唯一用户的集合作为散列表存储在内存中,并且以帖子 ID 作为键名。 这种方法适用于浏览量较少的文章,但一旦文章流行,阅读人数迅速增加,这种方法很难扩展。...为了保持对可能从 Redis 删除的旧帖子的维护,Abacus 定期将 Redis 的完整 HLL 过滤器以及每个帖子的计数记录到 Cassandra 集群中。...总结 我们希望浏览量计数器能够更好地帮助内容创作者了解每篇文章的情况,并帮助版主快速确定哪些帖子在其社区拥有大量流量。未来,我们计划利用数据管道的实时潜力向更多的人提供更多有用的反馈。

    1.3K90

    算法金 | 让数据讲故事:数据可视化的艺术与科学,几乎是每个领域都需要掌握的技能

    大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣] 数据可视化:不只是图表那么简单数据可视化不仅仅是把数字变成图形那么简单,它是一种强大的工具...2 常踩的坑现在,让我们一起来看看,如何避免在数据可视化过程中犯下常见的错误,让你的图表既美观又实用。...2.1 误导性颜色对比错误:使用过多颜色可能会让用户混淆,误解哪些数据更为重要,当可视化中的颜色过多时,用户可能需要更长的时间才能理解信息。...3 常见错误避免这些常见错误,让你的数据可视化更上一层楼3.1 相关性不代表因果关系错误:错误地将两个趋势相似的数据点解释为有因果关系。解决方案:始终寻找紧密结合的各种可视化之间的相关性。...3.5 不是每个洞察都需要在数据可视化中展示错误:有时,将所有数据都展示在图表中并非必要。解决方案:数据可视化应作为一种传递信息的手段,在适当的时候使用,避免过度展示。

    11500

    打分排序系统漫谈1 - 时间衰减

    如何考虑时间衰减和当前时段的关系。不同时段浏览量不同,如果一篇很好的文章在凌晨发布,因为当时浏览量低,文章可能永远没有置顶机会。能否对时间进行加权? 没有考虑到点赞量和文章热度的非线性关系。...或者用点赞率来衡量 同理也应该考虑到浏览量(PV)和点赞量的关系。...简单来说时间衰减的意义就是为了让新老文章的热度具有可比性,否则老的帖子会因为在更长的时间累计了更多的帖子而始终置顶。一种直观的解决办法就是给老的帖子增加时间惩罚项。...-\lambda dt \\ log(\frac{N(t)}{N_0}) = - \lambda t \\ \] 也可以从指数分布的角度来理解,\(N_0\)是集合初始的元素数量,其中每个元素都在衰减...= N_0 * P(x>t) \] 下一节我们接着就上述提出的几个问题中还没有解决的如何综合考虑浏览量和点赞量来打分的问题进行讨论。

    1.5K30

    MarsEdit 5 Mac下载,博客写作编辑工具

    MarsEdit 5 Mac版是一款强大的博客写作编辑工具,适用于WordPress,Blogger,Tumblr,TypePad,Movable Type以及任何支持标准MetaWeblog或AtomPub...完全兼容适用于WordPress,Blogger,Tumblr,TypePad,Movable Type以及任何支持标准MetaWeblog或AtomPub界面的博客。...轻松上传文件 将图像和文件直接附加到您的帖子,MarsEdit将在您发布时上传它们。...启用MarsEdit的Safari扩展。当您在网络上发现一些很酷的东西时,只需点击一下按钮就可以开始一个新的MarsEdit帖子。 离线自由 在没有互联网连接的情况下随时写信。...在船,飞机或火车上微调您的杰作,并在您重新上线时发布。 完美的预览 让MarsEdit的实时预览向您展示您的帖子在发布之前的外观。使用Markdown或其他文字过滤器?MarsEdit也会预览它。

    95320

    如何使用 Redis 实现大规模的帖子浏览计数

    来源:http://t.cn/EL1FB0M 统计方法 ---- 英文原文 本文翻译自全球访问量排名第8位的论坛Reddit博客上的文章,讲的是关于Reddit如何在海量浏览量下实时统计浏览量的。...img 本文我们就来聊一聊,Reddit 是如何在大规模下统计帖子浏览量的。 统计方法 我们对统计浏览量有四个基本的要求 计数必须达到实时或者接近实时。 每个用户在一个时间窗口内仅被记录一次。...帖子显示的统计数量的误差不能超过百分之几。 整个系统必须能在生成环境下,数秒内完成阅读计数的处理。 满足上面四个条件,其实比想象中要复杂。...Redis的HLL实现(我们最终的选择),我们觉得Redis的实现不管从文档完善程度还是配置和提供的API接口,来说做的都非常好。另外的加分点是,使用Redis可以减少我们对CPU和内存性能的担忧。...统计系统的第二部是一个称为Abacus 的kafka『消费者』它会真正的统计浏览量,并且让浏览量数据可以在整站和客户端上显示, 它接收从Nazar发送出来的事件消息,然后根据该消息中包含着标识值(Nazar

    2.1K40

    说一下使用 Redis 实现大规模的帖子浏览计数的思路

    说一下使用 Redis 实现大规模的帖子浏览计数的思路 统计方法 本文我们就来聊一聊,Reddit 是如何在大规模下统计帖子浏览量的。...统计方法 我们对统计浏览量有四个基本的要求 计数必须达到实时或者接近实时。 每个用户在一个时间窗口内仅被记录一次。 帖子显示的统计数量的误差不能超过百分之几。...和Scale两种实现 Twitter的Algebird库,Scala实现,Algebird的文档撰写非常好,但是关于它是如何实现HLL的,不是很容易理解。...Redis的HLL实现(我们最终的选择),我们觉得Redis的实现不管从文档完善程度还是配置和提供的API接口,来说做的都非常好。另外的加分点是,使用Redis可以减少我们对CPU和内存性能的担忧。...统计系统的第二部是一个称为Abacus 的kafka『消费者』它会真正的统计浏览量,并且让浏览量数据可以在整站和客户端上显示, 它接收从Nazar发送出来的事件消息,然后根据该消息中包含着标识值(Nazar

    11410

    GeneratePress主题如何添加文章浏览量(阅读量),详细教程

    这恰恰就是GeneratePress主题的强大之处,一旦你熟悉了操作,你可以为此添加修改主题外观的任何地方。 至于GeneratePress主题如何添加文章浏览量(阅读量)呢?...熟悉GeneratePress主题的同学都知道gp premium与GenerateBlocks 是必装的插件,用好之后,可以定制你想要的任何外观,在网站的任何地方修改制作你理想的主题。...5.注意替换主要帖子元,这样默认标题下方数据的就不会显示 6.模板已经制作好了,下面就是发布了,选择显示规则,你希望在哪些地方显示或者排除文章页面等都可以,下面只是示范,随便选的,具体根据你自己选择...至此GeneratePress主题如何添加文章浏览量,已经完成了,教程中的方法不仅仅是添加文章量,其中包含如何制作页面布局的思路,举一反三,在其他地方,用同样的方法可以替换主题默认的模块显示,选择你需要修改的钩子就行...5px; margin-left: 3px; } WordPress使用缓存插件如何刷新浏览量的方法 纯手打,给个好评吧。

    76820

    深入理解JavaScript系列(32):设计模式之观察者模式

    观察者模式又叫发布订阅模式(Publish/Subscribe),它定义了一种一对多的关系,让多个观察者对象同时监听某一个主题对象,这个主题对象的状态发生变化时就会通知所有的观察者对象,使得它们能够自动更新自己...continue; } a.push(this[i]); } return a; }; } 复制代码 版本三 如果想让多个对象都具有观察者发布订阅的功能...msg = 'dudu 推荐了的帖子:' + id; this.publish(msg); } }; var user = { vote: function (id)...(tom.read); blogger.addSubscriber(mm.show); blogger.recommend(123); //调用发布 //退订 blogger.removeSubscriber...总的来说,观察者模式所做的工作就是在解耦,让耦合的双方都依赖于抽象,而不是依赖于具体。从而使得各自的变化都不会影响到另一边的变化。

    44920

    五分钟让你搞懂“Volatile”关键字是如何帮助Java解决可见性问题的

    但你真的了解可见性问题的成因以及Volatile关键字是如何解决可见性问题的吗? 为什么会发生“可见性”的问题要从CPU开始说起了。 在计算机执行程序时,CPU负责处理每条指令。...具体来说,当程序运行时,它会预先将需要处理的数据从物理内存复制到CPU的高速缓存里。这样,CPU在进行计算时就可以直接从高速缓存中读取或写入数据,而不必每次都等待从物理内存中读取,从而提高了处理速度。...此时线程AB对变量的操作就对于线程CD来讲是“不可见的”,而线程CD对变量的操作对于线程AB来讲也是不可见的。...而这两个线程所属的CPU核心又不相同,操作的也不是一个同一个缓存 [线程A都把count自增为900了,线程B还在自增自己的CPU缓存中的值为50的count] 这下明白为什么两个线程对变量做自增操作会导致结果并不是我们的预想结果了吧...那我们的Volatile关键字是如何做到保证可见性呢? 这其实很好分析。为什么会出现我们上述代码的问题? 不就是因为线程操作的都是自己所属CPU核心中的缓冲存区吗?

    18910

    Instagram的排名算法是如何运作的?

    然而,直到今天,Instagram还从未确切地解释过算法是如何选择向你展示什么。...近似值:这个帖子最近是如何被分享的,及时发布的帖子比几个星期前发布的帖子要优先。...Instagram不会在feed中隐藏文章,如果你继续滚动,你会看到你关注的每个人发布的所有内容。...随着越来越多的用户和企业加入Instagram并更频繁地发布内容,但是每个用户的feed浏览时间都保持稳定,一般的帖子会被淹没,浏览量也会减少。...Instagram越能解决这个问题,将过多的内容创作推给故事,并让用户了解feed的运作方式,他们就越不会抱怨。脸书已经很不酷了,所以Instagram必须保持我们的良好形象。

    1.3K31
    领券