腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大数据技术架构
纯大数据技术分享,HBase/Kafka/Flink等技术栈,原理与实践,源码分析等。欢迎订阅公众号:大数据技术架构
专栏作者
举报
149
文章
317600
阅读量
95
订阅数
订阅专栏
申请加入专栏
全部文章
sql
hbase
spark
大数据
kafka
数据库
TDSQL MySQL 版
存储
hive
apache
缓存
https
api
编程算法
分布式
Elasticsearch Service
hadoop
云数据库 SQL Server
文件存储
消息队列 CMQ 版
网络安全
flink
mapreduce
jvm
数据湖
python
zookeeper
数据处理
node.js
云数据库 Redis
http
数据分析
linux
mongodb
开源
windows
云计算
java
搜索引擎
lucene/solr
网站
日志数据
jdk
数据结构
实时数仓
javascript
bash
scala
html
打包
ide
unix
bash 指令
云数据库 MongoDB
企业
数据迁移
socket编程
数据可视化
系统架构
es
负载均衡
区块链
数字货币
机器学习
tensorflow
ios
swift
c++
react
ecmascript
android
oracle
nosql
tomcat
全文检索
负载均衡缓存
nginx
容器镜像服务
神经网络
深度学习
专用宿主机
批量计算
数据备份
容器
devops
运维
压力测试
爬虫
jdbc
hashmap
tcp/ip
scrapy
rpc
rabbitmq
微服务
特征工程
性能测试
数据集成
搜索文章
搜索
搜索
关闭
蚂蚁绊倒大象?不起眼的小文件竟拖了Hadoop大佬的后腿
大数据
spark
hive
mapreduce
node.js
在使用Hadoop过程中,小文件是一种比较常见的挑战,如果不小心处理,可能会带来一系列的问题。HDFS是为了存储和处理大数据集(M以上)而开发的,大量小文件会导致Namenode内存利用率和RPC调用效率低下,block扫描吞吐量下降,应用层性能降低。通过本文,我们将定义小文件存储的问题,并探讨如何对小文件进行治理。
大数据技术架构
2021-03-05
1.5K
1
从 Elasticsearch 来看分布式系统架构设计
node.js
Elasticsearch Service
系统架构
分布式
存储
分布式系统类型多,涉及面非常广,不同类型的系统有不同的特点,批量计算和实时计算就差别非常大。这篇文章中,重点会讨论下分布式数据系统的设计,比如分布式存储系统,分布式搜索系统,分布式分析系统等。
大数据技术架构
2019-08-16
708
0
入门教程 | 从安装部署开始学习 Elasticsearch
Elasticsearch Service
tomcat
jdk
网站
node.js
Elasticsearch 是目前最流行的搜索引擎,学习 ES 的第一步便是安装部署。本文内容包含以下三部分:
大数据技术架构
2019-08-16
984
0
HBase案例 | 20000个分区导致HBase集群宕机事故处理
hbase
TDSQL MySQL 版
大数据
node.js
缓存
这是几个月前遇到的一次HBase集群宕机事件,今天重新整理下事故分析报告。概况的说是业务方的一个10节点HBase集群支撑百TB级别的数据量,集群region数量达 23000+,最终集群支持不住业务压力,带来了一次惨痛的宕机事件。
大数据技术架构
2019-08-16
2.1K
0
Hadoop、Spark、Kafka面试题及答案整理
node.js
spark
kafka
mapreduce
大数据
一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成。
大数据技术架构
2019-08-16
1.1K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档