腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据饕餮
专栏成员
举报
227
文章
220909
阅读量
60
订阅数
订阅专栏
申请加入专栏
全部文章(227)
大数据(28)
数据库(27)
存储(19)
python(17)
hadoop(17)
数据分析(17)
知识图谱(12)
编程算法(12)
hbase(11)
http(10)
模型(10)
linux(9)
开源(9)
ide(8)
部署(8)
人工智能(7)
企业(7)
机器人(7)
aigc(7)
深度学习(6)
爬虫(6)
数据处理(6)
windows(6)
人脸识别(5)
数据挖掘(5)
java(5)
xml(5)
内核(5)
入门(5)
node.js(4)
eclipse(4)
github(4)
mapreduce(4)
分布式(4)
架构设计(4)
产品设计(4)
配置(4)
数据仓库(4)
NLP 服务(3)
机器学习(3)
html(3)
git(3)
api(3)
中文分词(3)
unix(3)
文件存储(3)
大数据处理套件 TBDS(3)
电商(3)
数据安全(3)
jvm(3)
hive(3)
数据可视化(3)
https(3)
系统架构(3)
prompt(3)
sudo(3)
视频(3)
音频(3)
其他(2)
c++(2)
.net(2)
云数据库 Redis(2)
打包(2)
神经网络(2)
TDSQL MySQL 版(2)
网络安全(2)
jdk(2)
zookeeper(2)
uml(2)
安全(2)
chatgpt(2)
etl(2)
笔记(2)
编码(2)
博客(2)
产品(2)
产品经理(2)
程序员(2)
工具(2)
工作流(2)
函数(2)
互联网(2)
基础(2)
开源框架(2)
数据采集(2)
网络(2)
异常(2)
费用中心(1)
官方文档(1)
腾讯云学堂(1)
php(1)
bootstrap(1)
json(1)
android(1)
云数据库 SQL Server(1)
oracle(1)
nosql(1)
flask(1)
tomcat(1)
搜索引擎(1)
lucene/solr(1)
apache(1)
bash 指令(1)
tornado(1)
云函数(1)
存储网关(1)
云直播(1)
访问管理(1)
云数据库 MongoDB(1)
人脸核身(1)
弹性 MapReduce(1)
云推荐引擎(1)
mongodb(1)
图像处理(1)
人脸支付(1)
网站(1)
数据备份(1)
混合云存储(1)
金融(1)
渲染(1)
url 安全(1)
yarn(1)
互联网金融(1)
shell(1)
正则表达式(1)
面向对象编程(1)
opencv(1)
unity(1)
ftp(1)
keras(1)
tcp/ip(1)
scrapy(1)
rpc(1)
kernel(1)
socket编程(1)
anaconda(1)
微信(1)
物联网(1)
数据结构(1)
信息流(1)
云计算(1)
sdk(1)
es(1)
项目管理(1)
app(1)
apt(1)
audio(1)
bi(1)
block(1)
colors(1)
conda(1)
data(1)
db(1)
diagram(1)
dimensions(1)
documentation(1)
ffmpeg(1)
gan(1)
it(1)
lifecycle(1)
matrix(1)
max(1)
min(1)
model(1)
monitor(1)
na(1)
openai(1)
package(1)
patch(1)
path(1)
pip(1)
process(1)
pypi(1)
random(1)
reference(1)
return(1)
root(1)
server(1)
status(1)
sum(1)
table(1)
word(1)
编译(1)
测试(1)
代理(1)
翻译(1)
服务器(1)
管理(1)
规范化(1)
解决方案(1)
接口(1)
镜像(1)
开发(1)
客户端(1)
框架(1)
流量(1)
前端(1)
权限(1)
日志(1)
软件(1)
实践(1)
实时计算(1)
数据(1)
算法(1)
系统(1)
系统设计(1)
线程(1)
隐私(1)
源码(1)
终端(1)
主机(1)
字符串(1)
搜索文章
搜索
搜索
关闭
Hadoop2.2.0 eclipse插件编译及Ecliipse配置说明(图文版)
打包
hadoop
eclipse
ide
最近在做一个城商行项目的POC测试it版本,涉及到编译Linux64bti的源码和开发插件使用,作为笔记分享给大家。
数据饕餮
2019-01-14
358
0
基于Hadoop的云盘系统客户端技术难点之三 小文件存储优化
hadoop
打包
存储
hbase
首先明确概念,这里的小文件是指小于HDFS系统Block大小的文件(默认64M),如果使用HDFS存储大量的小文件,将会是一场灾难,这取决于HDFS的实现机制和框架结构,每一个存储在HDFS中的文件、目录和块映射为一个对象存储在NameNode服务器内存中,通常占用150个字节。如果有1千万个文件,就需要消耗大约3G的内存空间。如果是10亿个文件呢,简直不可想象。这里需要特别说明的是,每一个小于Block大小的文件,存储是实际占用的存储空间仍然是实际的文件大小,而不是整个block大小。
数据饕餮
2019-01-14
1K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档