首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

高性能 Java 计算服务的性能调优实战

一、背景介绍在 Push 推荐中,线上服务从 Kafka 接收需要触达用户的事件,之后为这些目标用户选出最合适的文章进行推送。服务由 Java 开发,CPU 密集计算型。...随着业务的不断发展,请求并发及模型计算量越来越大,导致工程上遇到了性能瓶颈,Kafka 消费出现严重的积压现象,无法及时完成目标用户的分发,业务增长诉求得不到满足,故亟需进行性能专项优化。...我们的推荐服务使用高配计算资源(64核256G),GC的影响因素挺可观;通过采集监控在线服务 GC 数据,发现我们的服务 GC 情况挺糟糕的,每分钟YGC累计耗时约 10s。...4.1.3 优化效果切换到堆外缓存后,服务 YGC 降低到了 800ms / 每分钟,端到端的整体吞吐量上涨了约 20%。...我们使用C++改写了模型推理计算部分,包括权重map的存储与检索、排序得分计算等逻辑;然后将C++代码输出为 so 库文件,Java程序通过 native 方式调用,实现将权重map从 Jvm 堆内移出

62430
您找到你想要的搜索结果了吗?
是的
没有找到

闲话高性能计算

与此相比,高性能计算似乎一直很热,又一直离我们很远。...说高性能计算一直很热,是因为从天河超级计算机开始,中国就加入了超级计算机的全球军备竞赛,年年争夺超算世界冠军;说离我们远,是因为我们在日常的工作生活中见识超级计算机的机会并不多。...,高性能计算又频繁被提及,变成了一个热门话题。...不一样的高性能计算  如今被频繁提及的高性能计算和传统的HPC已经大不相同了。包括AI、生命科学、计算化学家等技术的突飞猛进无疑凸显了对计算力的强烈需求,从而推动了HPC的发展和变化。...如果把这些还在不断积累的数据看做金矿(真的是金矿),那大量的计算就是挖掘金矿的工具,更高性能计算能力就是现代化金矿挖掘机!

73240

Linux高性能服务器编程》学习小结3

> 10.194.70.79 13579 5 配置文件第一行指定 荷载均衡服务器监听...socket的ip4地址和端口号; 下面的每一个logical指定一个实际运行着的服务器,如前面小结1 2 中所述的多进程或者多线程服务器;三个字段分别指定:服务器的ip4地址,服务服务端口,以及进程池中的进程与这个服务器保持多少个连接...bool m_srv_closed; }; 每个子进程与实际处理业务的服务器所保持的连接,都对应一个conn类,它负责维持客户端 同 子进程 以及 子进程 同 服务器之间的数据转发,子进程只做一个数据的搬运工..., const sockaddr_in& client_addr ) { m_cltfd = sockfd; m_clt_address = client_addr; } // 绑定服务端...最后感谢 游双 的《Linux高性能服务器编程》

3.1K10

Linux高性能服务器编程》读书笔记:linux服务器程序规范

服务器程序规范,需要强化和遵守的,作者给列了4条规范: 1、Linux服务器程序一般以后台进程形式运行,也就是以daemon守护进程的方式,守护进程的父进程通常是init进程(PID进程为1),作者在7.6...服务程序后台化给出了一个程序的清单,还是很有参考意义的。...后台进程形式运行,也就是通过fork一个子进程,结束父进程的方式运行,这样避免很多前台启动,随着操作终端界面的关闭而结束服务器程序的运行; Linux服务器程序的用户信息也是容易忽略和出问题的地方,UID...2、Linux服务器程序通常有一套日志系统,至少能输出日志到文件,有的高级服务器还能输出日志到专门的UDP服务器,大部分后台进程都在/var/log目录下拥有自己的日志目录。...,系统响应缓慢的事故; 3、Linux服务器程序通常是可配置的,通常能处理很多命令行选项,如果一次运行的选项太多,则可以用配置文件进行管理。

1.1K20

高性能计算简要复习

1、概念 集群 PVP:Player VS Player PVP拥有多个高性能向量处理器,有向量寄存器和指令缓冲,不用高速缓存,共享内存。...学科 HPC:高性能计算。并行计算、超级计算。 HPCC:高性能计算与通信。配合高速网络的使用。 Distribute Computing:分布式计算。比起性能更注重功能。...Cloud Computing:云计算。按需提供资源,使计算像电力一样提供。...5、PRAM和BSP模型上计算N阶向量内积 其实不懂。 PRAM:每个处理器2N/p个加法和乘法,树规约方式计算局部和的复杂度logP。2N/p+logP。...7、并行计算机评测/基准测试 并行计算机性能评测:通过CPU基本性能指标、并行和通信开销分析、可用性、性价比等方面进行机器性能测评。通过加速比、效率、扩展性进行算法级性能测评。

1.4K10

高性能计算(HPC)概述

高性能计算的概念 高性能计算(HPC,High Performance Computing) 的含义有很多,感觉最贴切的还是 Oracle中国中说的这句: 高性能计算 (HPC) 是指通过聚合计算能力来提供比传统计算机和服务器更强大的计算性能...集群的种类 说到高性能计算,就要说到计算机集群。...从而保证用户的业务服务程序能够对外提供不间断的服务。 负载均衡集群 负载均衡集群是指将工作量分配到多台计算机以达到最佳的资源利用率、最大限度地提高吞吐量、缩短响应时间和避免过载的计算机集群系统。...高性能计算高性能计算的优势 速度:HPC的低延迟网络结构能够在数分钟内完成大量计算。 成本:HPC快速,低成本,像公有云一样只需为所使用资源付费。...高性能计算的应用 超级计算机代表着高性能计算系统的最尖端水平。随着计算机的处理能力的不断提升,超级计算机所能做到的事情也越来越多。

79410

深度学习趋势:云计算or高性能计算

Google在世界各地的数据中心拥有海量计算机,对于吴恩达的工作,计算量绝对绰绰有余。...但配置如此强大的计算机集群并不是一件容易的事情,如果有一台服务器忽然当机(如果你同时使用1000台机器,这种事情几乎每天都会发生),就会减小准确性。...不过,在高性能计算机网络的支持下,现在由GPU支持的深度学习可以解决上述问题。...实验室负责人Barry Chen说道: “我们希望项目结束时,可以构建成世界上最大的神经网络训练算法,当然这需要高性能计算机支持。” Google的方式 那么,Google在做什么呢?...“云计算VS高性能计算,其实和公司文化、可用资源、甚至是企业品味相关。作为Google研究人员,我当然为Google内部系统感到高兴。” VIA wired

1.6K30

Python高性能计算库——Numba

摘要: 在计算能力为王的时代,具有高性能计算的库正在被广泛大家应用于处理大数据。例如:Numpy,本文介绍了一个新的Python库——Numba, 在计算性能方面,它比Numpy表现的更好。...想象一下,在Python中编写一个模块,必须一个元素接着一个元素的循环遍历一个非常大的数组来执行一些计算,而不能使用向量操作来重写。这是很不好的主意,是吧?...他们的目标是加快面向数组的计算,我们可以使用它们库中提供的函数来解决。 4.示例和速度比较 熟练的Python用户永远不会使用上述代码实现sum功能,而是调用numpy.sum。...在每个时间段结束时,计算水流量,这不仅取决于在同一时间步长下的雨,而且也取决于在内部模型状态(或储存)。在这种情况下,我们就需要考虑以前时间步长的状态和输出。...在计算能力决定未来的时代,Numba一定会被更多人接受。 以上就是我的介绍,希望有人现在有动力去看看Numba库。

2.5K91

OpenCV高性能计算基础介绍

前言 本文分享一篇关于opencv高性能计算基础的文章,这是一个作者对工作期间使用OpenCV和CUDA开发高性能算法库的过程所涉及到的知识要点和踩坑的记录,将会涉及OpenCV, CUDA和C++的一些知识...OpenCV在不断的迭代中,逐渐向几个方向扩展着其计算能力,下面以OpenCV中每个方向对应的类为锚进行列举: cv::Mat OpenCV中最基础的数据结构,具有存储多种数据类型的多维矩阵的能力,也可用来表示图像...与其他的Mat类不同,GMat并不会存储实际的数据,而是会记录用户对GMat进行的操作,并最终组合多个GMat生成一个计算图用以处理真正的计算。基于图的计算,是G-API的核心思想。...计算图将计算式声明与计算分离,可以带来至少两个好处:一是OpenCV可以在内部提供分散函数无法提供的跨函数优化,如算术操作的合并,高速缓存的复用和避免多次分配buffer;二是统一的接口使得用户可以相对简单地选择计算时的后端...如何利用OpenCV CUDA模块进行快速的自定义高性能图像算法开发将是本专栏的重点内容。 内存优化 内存的管理是几乎每个C++项目都要谨慎考虑的问题。

1.5K20

腾讯高性能计算服务星辰.机智,海量算力,智造未来

要看后面连接的计算机谁算力更充足。 ? 言归正传,怎么样构建稳定高效可依赖的计算服务呢?...本文将概论星辰.机智计算服务背后的技术和能力。...作为高性能机器学习训练平台,机智前期主要打造能力,服务兄弟团队的核心需求,目前平台:     1)支持了内部兄弟团队 信息流场景线上模型训练任务;支持游戏AI兄弟团队 游戏AI的多款模型训练。...2.展望 星辰和机智希望在接下来,继续在怎么样为用户提供高性能计算服务上深耕:算力虚拟化(时分复用,空分复用),任务队列,训练加速等多种手段,提升可用算力量及使用便捷程度,让海量算力和高性能计算触手可及...我们希望将高性能计算服务建设为公司的基础设施,来加速公司AI产品的研发效率和创新研究。 我们不研究AI,我们只智造AI。

2.5K41

linux、centos7 安装 frp 搭建高性能内网穿透服务

原文链接:https://www.aiprose.com/blog/17 本片文章全程使用的域名是aiprose.com frp 是一个可用于内网穿透的高性能的反向代理应用,支持 tcp, udp...位下载amd64,我写文章的时候,最新版本是0.22 wget https://github.com/fatedier/frp/releases/download/v0.22.0/frp_0.22.0_linux_amd64.../frpc.ini & 3.上面是吧公网服务器的6000端口映射到内网服务器的22端口,这样就可以随时使用ssh连接内网服务器了。 ?...,以下示例为 http 服务,https 服务配置方法相同, vhost_http_port 替换为 vhost_https_port, type 设置为 https 即可。...{subdomain_host} 解析到 frps 所在服务器。之后用户可以通过 subdomain 自行指定自己的 web 服务所需要使用的二级域名,通过 {subdomain}.

7.3K10

高性能与云计算:背道而驰?

计算是时下非常火的一种新型的IT技术,云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。...云计算是否会取代超级计算机,来承担数据密集型、I/O密集型的应用呢?相信很多网友都会有这些问题。那么今天我们就来谈一下未来高性能与云计算是背道而驰还是走向融合?...超算与云计算的侧重点不同,但是二者之间也有很多相关的特点,比如,两者都使用了分布式计算、网格计算、集群、高密度计算,其中也有一些特定的领域利用云计算技术来从事高性能类的应用。...例如,北京市计算中心打造的“北京工业云”,为中小企业提供产品设计模拟服务。...其实云计算高性能有着千丝万缕的联系,事实上,超级计算中心也是一种早期的运算模式,通过昂贵的计算资源部署,多个领域的用户通过互联网远程使用计算服务并根据使用量来进行支付费用。

1.9K40

macOS的OpenCL高性能计算

随着深度学习、区块链的发展,人类对计算量的需求越来越高,在传统的计算模式下,压榨GPU的计算能力一直是重点。...NV系列的显卡在这方面走的比较快,CUDA框架已经普及到了高性能计算的各个方面,比如Google的TensorFlow深度学习框架,默认内置了支持CUDA的GPU计算。...而实际上,现在的高性能显卡其实也就剩下了NV/AMD两家的竞争,这样基本没什么意义的性能损失不能不说让人纠结。所以在个人工作站和个人装机市场,通常的选择都是NV系列的显卡。...下面是苹果官方给出的一个OPENCL的入门例子,结构很清晰,展示了使用显卡进行高性能计算的一般结构,我在注释中增加了中文的说明,相信可以让你更容易的上手OPENCL显卡计算。...,计算启动的时候采用队列的方式,因为一般计算任务的数量都会远远大于可用的内核数量, // 在下面函数中,local是可用的内核数,global是要计算的数量,OPENCL会自动执行队列,完成所有的计算

2K80

Linux内核高性能优化

Linux内核高性能优化 目录 解释 部分子目录 kernel 内核管理相关,进程调度等 sched/fork等 fs 文件子系统 ext4/f2fs/fuse/debugfs/proc等 mm 内存子系统...drivers 设备驱动 staging/cpufreq/gpu等 arch 所有CPU体系结构相关的代码 armm64/x86等 include 头文件 linux/uapi/asm_generic...2^20-1 fs.file-max = 1048575 # 网络层优化 # listen()的默认参数,挂起请求的最大数量,默认128 net.core.somaxconn = 1024 # 增加Linux...tcp_window_scaling = 1 # 进入SYN包的最大请求队列.默认1024 net.ipv4.tcp_max_syn_backlog = 8192 # 打开TIME-WAIT套接字重用功能,对于存在大量连接的Web服务器非常有效...net.ipv4.tcp_tw_recycle = 1 net.ipv4.tcp_tw_reuse = 0 # 表示是否启用以一种比超时重发更精确的方法(请参阅 RFC 1323)来启用对 RTT 的计算

1.2K30
领券