首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

每个帖子评论

每行可以是一个帖子或对该帖子评论。 如果是帖子的话,parent_id 就是 null。 对于评论来说,parent_id 就是表中对应帖子 sub_id。...编写 SQL 语句以查找每个帖子评论。 结果表应包含帖子 post_id 和对应评论 number_of_comments 并且按 post_id 升序排列。...Submissions 可能包含重复评论。您应该计算每个帖子唯一评论。 Submissions 可能包含重复帖子。您应该将它们视为一个帖子。...表中 ID 为 3 评论重复出现了,所以我们只对它进行了一次计数。 表中 ID 为 2 帖子有 ID 为 5 和 10 两个评论。 ID 为 12 帖子在表中没有评论。...表中 ID 为 6 评论是对 ID 为 7 已删除帖子评论,因此我们将其忽略。

64600

Reddit 如何实现大规模帖子浏览计数

到目前为止,投票得分和评论数量是特定帖子活动主要指标。然而,Reddit 有许多访问者在没有投票或评论情况下阅读内容。我们希望建立一个能够捕捉到帖子阅读数量系统。...然后将该数量展示给内容创建者和版主,以便他们更好地了解特定帖子活动。 在这篇文章中,我们将讨论我们如何大规模地实现计数。 计数方法 对浏览计数有四个主要要求: ◈ 计数必须是实时或接近实时。...为了实时保持准确计数,我们需要知道某个特定用户是否曾经访问过这个帖子。要知道这些信息,我们需要存储先前访问过每个帖子用户组,然后在每次处理对该帖子新访问时查看该组。...stream-lib 中代码有很好文档,但是要理解如何正确使用这个库并且调整它以满足我们需求是有些困难。 ☉ Redis HLL 实现(我们选择)。...为了保持对可能从 Redis 删除帖子维护,Abacus 定期将 Redis 完整 HLL 过滤器以及每个帖子计数记录到 Cassandra 集群中。

1.2K90

Mysql如何随机获取表中呢rand()

随机获取数据业务场景,想必大家都有遇到过,今天我们分析一下如何正确显示随机消息. mysql> CREATE TABLE `words` ( `id` int(11) NOT NULL AUTO_INCREMENT...我们在来看看上面随机获取字段sql语句是如何执行 创建一个临时表,临时表使用是memory引擎,表里面有两个字段,一个字段double类型,我们叫R,另一个字段varchar(64),记为W,且没有建立索引...上图我们发现sort_buffer中位置信息,是个什么概念呢,而Mysql是如何定位一行数据呢, 首先我们知道mysql中有以下规则 对于有主键innodb表来说,rowid就是我们主键 对于没有主键...select * from t where id >= @X limit 1; 虽然上面可以获取一个,但是他并不是一个随机,因为如何表中id可能存在空洞,导致每一行获取概率并不一样,如id=1,2,4,5...现在如果要获取三个随机,根据随机算法2思路 获取整张表总行数C 根据同样共识获取Y1,Y2,Y3 再执行limit Y,1.获取三个随机 对应sql语句如下 mysql> select

4.5K20

【每日SQL打卡】​​​​​​​​​​​​​​​DAY 21丨每个帖子评论【难度中等】​

每行可以是一个帖子或对该帖子评论。 如果是帖子的话,parent_id 就是 null。 对于评论来说,parent_id 就是表中对应帖子 sub_id。...编写 SQL 语句以查找每个帖子评论。 结果表应包含帖子 post_id 和对应评论 number_of_comments 并且按 post_id 升序排列。...Submissions 可能包含重复评论。您应该计算每个帖子唯一评论。 Submissions 可能包含重复帖子。您应该将它们视为一个帖子。...表中 ID 为 3 评论重复出现了,所以我们只对它进行了一次计数。 表中 ID 为 2 帖子有 ID 为 5 和 10 两个评论。 ID 为 12 帖子在表中没有评论。...表中 ID 为 6 评论是对 ID 为 7 已删除帖子评论,因此我们将其忽略。

40020

如何使用 Redis 实现大规模帖子浏览计数

来源:http://t.cn/EL1FB0M 统计方法 ---- 英文原文 本文翻译自全球访问量排名第8位论坛Reddit博客上文章,讲的是关于Reddit如何在海量浏览量下实时统计浏览量。...img 本文我们就来聊一聊,Reddit 是如何在大规模下统计帖子浏览量。 统计方法 我们对统计浏览量有四个基本要求 计数必须达到实时或者接近实时。 每个用户在一个时间窗口内仅被记录一次。...帖子显示统计数量误差不能超过百分之几。 整个系统必须能在生成环境下,数秒内完成阅读计数处理。 满足上面四个条件,其实比想象中要复杂。...和Scale两种实现 TwitterAlgebird库,Scala实现,Algebird文档撰写非常好,但是关于它是如何实现HLL,不是很容易理解。...stream-lib库中HyperLogLog++实现,Java编写。 stream-lib代码文档化做很好,但我们对如何适当调优它,还是有些困惑

2K40

java如何获取随机(两种方式)

大家好,又见面了,我是你们朋友全栈君。 在小知识,都有深挖之价值。 很久没有生产随机,竟然忘了!我明明记得我做过关于随机产生总结,but,我翻遍了整个笔记本,就是没找到。...//获取100以内随机 package com.isea.java; import java.util.Random; public class TestRandom { public static...Random random = new Random(); System.out.println("Method two:" + random.nextInt(100)); } } 上文代码中演示了两种获取随机方法...: 方法一: 直接使用Math.random()这个静态方法,random()方法返回一个[0,1)随机; 方法二: 使用java.util.Random类,创建一个实例,使用nextInt...(int count)获得count以内整数,不含count 曾经,有一个女孩对我说了这样一句话:希望能够给你鼓励和安慰,也怕给你伤害和心碎,最后她成功做到了。

90220

【精选好文】Reddit如何统计每个帖子浏览量

欢迎指正错误~ 我们想要更好向用户展示 Reddit 规模。为了这一点,投票和评论是一个帖子最重要指标。然而,在 Reddit 上有相当多用户只浏览内容,既不投票也不评论。...所以我们想要建立一个能够计算一个帖子浏览系统。这一数字会被展示给帖子创作者和版主,以便他们更好了解某个帖子活跃程度。 在这篇博客中,我们将讨论我们是如何实现超大数据量计数。...计数机制 对于计数系统我们主要有四种需求: 1、帖子浏览必须是实时或者近实时,而不是每天或者每小时汇总。 2、同一用户在短时间内多次访问帖子,只算一个浏览量。...这种实现方式对于访问量低帖子是可行,但一旦一个帖子变得流行,访问量剧增时就很难控制了。甚至有的帖子有超过 100 万独立访客!...2、stream-lib中提供 HyperLogLog++, 采用 Java 实现。stream-lib 中代码文档齐全,但有些难理解如何合适使用并且改造符合我们需求。

1.3K40

Java获取随机3种方法

()*10)); } //通过java.Math包random方法得到1-10int随机 方法3 Random ra =new Random(); for (int i=0;i<30;i++)...总结:不带种子多次返回结果不一样,带种子多次返回结果一样,故每次使用随机应new一个出来即可保证全随机 然并卵,仅仅需要一个随机的话,直接用毫秒数就好了 两种方式差别在于 (1) 首先请打开Java...Doc,我们会看到Random类说明: 此类实例用于生成伪随机流,此类使用 48 位种子,该种子可以使用线性同余公式对其进行修改。...(2) 如果没有提供种子,Random实例种子将是当前时间毫秒数,可以通过System.currentTimeMillis()来获得当前时间毫秒数。...public Random() { this(System.currentTimeMillis()); } //所以new什么Random啊,直接获取毫秒数

3.9K10
领券