腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
最新最全的大数据技术体系
专栏作者
举报
717
文章
541715
阅读量
33
订阅数
订阅专栏
申请加入专栏
全部文章(717)
大数据(215)
sql(121)
编程算法(110)
数据库(108)
数据(78)
java(70)
spark(68)
hive(66)
node.js(65)
kafka(51)
hadoop(48)
python(47)
存储(42)
hbase(39)
云数据库 SQL Server(32)
TDSQL MySQL 版(30)
物联网(27)
flink(27)
api(26)
mapreduce(25)
网络安全(25)
linux(24)
网站(24)
数据分析(24)
https(23)
模型(23)
文件存储(22)
apache(21)
yarn(21)
服务(21)
分布式(20)
ide(19)
数据结构(19)
javascript(18)
scala(17)
xml(17)
spring(17)
windows(15)
函数(15)
html(14)
腾讯云测试服务(14)
jar(13)
maven(13)
http(13)
容器(13)
缓存(13)
tcp/ip(13)
数据处理(13)
设计(13)
机器学习(12)
vue.js(12)
基础(12)
配置(12)
语法(11)
bash(10)
容器镜像服务(10)
数据湖(10)
进程(10)
可视化(10)
统计(10)
json(9)
nosql(9)
打包(9)
微服务(9)
pyspark(9)
oracle(8)
shell(8)
面向对象编程(8)
腾讯云开发者社区(8)
tomcat(7)
nginx(7)
消息队列 CMQ 版(7)
yum(7)
jdbc(7)
zookeeper(7)
gpt(7)
编码(7)
博客(7)
公众号(7)
php(6)
bash 指令(6)
推荐系统(6)
微信(6)
云计算(6)
bi(6)
flume(6)
table(6)
测试(6)
工程师(6)
内存(6)
算法(6)
数据接口(6)
对象存储(5)
c++(5)
jsp(5)
unix(5)
人工智能(5)
电商(5)
jdk(5)
mybatis(5)
数据可视化(5)
虚拟化(5)
es(5)
error(5)
openai(5)
工具(5)
全栈(5)
视频(5)
索引(5)
腾讯(5)
系统(5)
原理(5)
字符串(5)
ajax(4)
云数据库 Redis(4)
mvc(4)
git(4)
github(4)
全文检索(4)
深度学习(4)
专用宿主机(4)
访问管理(4)
日志数据(4)
企业(4)
数据安全(4)
hashmap(4)
aop(4)
mysql(4)
部署(4)
服务器(4)
集群(4)
教程(4)
解决方案(4)
入门(4)
事务(4)
线程(4)
AI绘画(4)
其他(3)
servlet(3)
jquery(3)
access(3)
搜索引擎(3)
lucene/solr(3)
神经网络(3)
日志服务(3)
jvm(3)
正则表达式(3)
rpc(3)
sdn(3)
airflow(3)
exception(3)
join(3)
mq(3)
nested(3)
redis(3)
set(3)
shuffle(3)
编程(3)
插件(3)
产品(3)
程序(3)
工作(3)
接口(3)
开发(3)
开发者(3)
连接(3)
排序(3)
同步(3)
需求分析(3)
优化(3)
负载均衡(2)
NLP 服务(2)
自动驾驶(2)
c#(2)
regex(2)
react(2)
css(2)
负载均衡缓存(2)
批量计算(2)
mongodb(2)
serverless(2)
parcel(2)
游戏(2)
开源(2)
自动化(2)
运维(2)
ssh(2)
监督学习(2)
rabbitmq(2)
kernel(2)
spring cloud(2)
安全(2)
机器人(2)
系统架构(2)
mvcc(2)
ascii(2)
sdk(2)
迁移(2)
实时etl(2)
数据库管理(2)
app(2)
break(2)
bug(2)
char(2)
connect(2)
connection(2)
csv(2)
for循环(2)
gateway(2)
host(2)
list(2)
map(2)
null(2)
pandas(2)
pip(2)
process(2)
prompt(2)
pycharm(2)
rdd(2)
select(2)
server(2)
service(2)
truncate(2)
version(2)
video(2)
view(2)
word(2)
百度(2)
变量(2)
编译(2)
对象(2)
多线程(2)
集合(2)
架构(2)
镜像(2)
框架(2)
日志(2)
软件(2)
实践(2)
数据存储(2)
数据类型(2)
图表(2)
微信公众号(2)
性能(2)
异步(2)
源码(2)
费用中心(1)
云服务器(1)
内容分发网络 CDN(1)
ruby(1)
bootstrap(1)
ecmascript(1)
android(1)
eclipse(1)
centos(1)
容器服务(1)
云直播(1)
命令行工具(1)
云推荐引擎(1)
DevOps 解决方案(1)
数据备份(1)
o2o(1)
渲染(1)
vr 视频解决方案(1)
express(1)
kubernetes(1)
压力测试(1)
数据迁移(1)
无人驾驶(1)
wordpress(1)
强化学习(1)
spring boot(1)
线性回归(1)
seo(1)
二叉树(1)
dubbo(1)
jenkins(1)
gradle(1)
scikit-learn(1)
socket编程(1)
lamp(1)
ntp(1)
小程序(1)
网站建设(1)
nat(1)
processing(1)
信息流(1)
任务调度(1)
聚类算法(1)
实时监控(1)
Elasticsearch Service(1)
数据集成(1)
大数据存储(1)
汽车(1)
教育(1)
腾讯云(1)
alias(1)
alpha(1)
amqp(1)
async(1)
backend(1)
between(1)
chatgpt(1)
classnotfoundexception(1)
clickhouse(1)
cloud(1)
cloudera(1)
code(1)
conda(1)
config(1)
core(1)
count(1)
cpu(1)
data(1)
date(1)
default(1)
dll(1)
drawing(1)
ear(1)
echarts(1)
edge(1)
equals(1)
excel(1)
exec(1)
execution(1)
export(1)
field(1)
fifo(1)
function(1)
geo(1)
having(1)
hdfs(1)
hibernate(1)
ibatis(1)
import(1)
insert(1)
int(1)
io(1)
it(1)
jetbrains(1)
jetty(1)
key(1)
matplotlib(1)
model(1)
monitor(1)
partition(1)
path(1)
port(1)
prometheus(1)
ps(1)
regexp(1)
reset(1)
rows(1)
runtimeexception(1)
socket(1)
sqoop(1)
ssl(1)
substr(1)
sys(1)
tampermonkey(1)
target(1)
this(1)
thread(1)
time(1)
timeout(1)
token(1)
txt(1)
types(1)
unique(1)
vim(1)
window(1)
worker(1)
zero(1)
报表(1)
备份(1)
并发(1)
产品经理(1)
程序员(1)
磁盘(1)
代理(1)
登录(1)
递归(1)
地图(1)
队列(1)
多进程(1)
二维码(1)
翻译(1)
分页(1)
高可用(1)
工具类(1)
行业(1)
华为(1)
技巧(1)
监控(1)
脚本(1)
客户端(1)
流量(1)
论文(1)
内核(1)
配色(1)
权限(1)
事件(1)
实时计算(1)
手机(1)
数据仓库(1)
数据同步(1)
数学(1)
数组(1)
搜索(1)
推送(1)
网关(1)
效率(1)
性能监控(1)
虚拟机(1)
异常(1)
域名(1)
在线教育(1)
主机(1)
LLM(1)
搜索文章
搜索
搜索
关闭
Flink应用案例统计实现TopN的两种方式
php
hashmap
flink
大数据
编程算法
窗口的计算处理,在实际应用中非常常见。对于一些比较复杂的需求,如果增量聚合函数 无法满足,我们就需要考虑使用窗口处理函数这样的“大招”了。 网站中一个非常经典的例子,就是实时统计一段时间内的热门 url。例如,需要统计最近 10 秒钟内最热门的两个 url 链接,并且每 5 秒钟更新一次。我们知道,这可以用一个滑动窗口 来实现,而“热门度”一般可以直接用访问量来表示。于是就需要开滑动窗口收集 url 的访问 数据,按照不同的 url 进行统计,而后汇总排序并最终输出前两名。这其实就是著名的“Top N” 问题。 很显然,简单的增量聚合可以得到 url 链接的访问量,但是后续的排序输出 Top N 就很难 实现了。所以接下来我们用窗口处理函数进行实现。
Maynor
2022-06-30
935
0
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day03】——JavaSE
hashmap
java
面向对象编程
jdk
jvm
JDK(Java Development Kit)是整个 Java 的核心,是 java 开发工具包,包括了 Java 运行环境 JRE、Java 工具和 Java 基础类库。 JRE(Java Runtime Environment)是运行 JAVA 程序所必须的环境的集合,包含 java 虚拟机和 java 程序的一些核心类库。 JVM 是 Java Virtual Machine(Java 虚拟机)的缩写,是整个 java 实现跨平台的最核心的部分,能够运行以 Java 语言写作的软件程序。
Maynor
2022-03-28
298
0
Java大数据面试复习30天冲刺 - 日积月累,每日五题【Day02】——JavaSE
编程算法
java
hashmap
面向对象编程
数据结构
数组: 数组是最常用的数据结构,数组的特点是长度固定,可以用下标索引,并且所有的元素的类型都是一致的。数组常用的场景有:从数据库里读取雇员的信息存储为EmployeeDetail[ ];把一个字符串转换并存储到一个字节数组中便于操作和处理等等。尽量把数组封装在一个类里,防止数据被错误的操作弄乱。另外,这一点也适合其他的数据结构。 列表: 列表和数组很相似,只不过它的大小可以改变。列表一般都是通过一个固定大小的数组来实现的,并且会在需要的时候自动调整大小。列表里可以包含重复的元素。常用的场景有,添加一行新的项到订单列表里,把所有过期的商品移出商品列表等等。一般会把列表初始化成一个合适的大小,以减少调整大小的次数。 集合: 集合和列表很相似,不过它不能放重复的元素。 堆栈: 堆栈只允许对最后插入的元素进行操作(也就是后进先出,Last In First Out – LIFO)。如果你移除了栈顶的元素,那么你可以操作倒数第二个元素,依次类推。这种后进先出的方式是通过仅有的peek(),push()和pop()这几个方法的强制性限制达到的。 队列: 队列和堆栈有些相似,不同之处在于在队列里第一个插入的元素也是第一个被删除的元素(即是先进先出)。这种先进先出的结构是通过只提供peek(),offer()和poll()这几个方法来访问数据进行限制来达到的。例如,排队等待公交车,银行或者超市里的等待列队等等,都是可以用队列来表示。 链表: 链表是一种由多个节点组成的数据结构,并且每个节点包含有数据以及指向下一个节点的引用,在双向链表里,还会有一个指向前一个节点的引用。例如,可以用单向链表和双向链表来实现堆栈和队列,因为链表的两端都是可以进行插入和删除的动作的。当然,也会有在链表的中间频繁插入和删除节点的场景。Apache的类库里提供了一个TreeList的实现,它是链表的一个很好的替代,因为它只多占用了一点内存,但是性能比链表好很多。也就是说,从这点来看链表其实不是一个很好的选择。
Maynor
2022-03-28
300
0
Java知识面试题复习(六)集合容器概述
编程算法
hashmap
容器
java
数据结构
集合框架是为表示和操作集合而规定的一种统一的标准的体系结构。 任何集合框架都包含三大块内容:对外的接口、接口的实现和对集合运算的算法。
Maynor
2021-12-07
602
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档