腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
桥路_大数据
专栏成员
举报
183
文章
246415
阅读量
36
订阅数
订阅专栏
申请加入专栏
全部文章(183)
大数据(47)
hive(28)
sql(26)
数据(25)
存储(24)
数据库(20)
hadoop(19)
mapreduce(18)
mysql(16)
node.js(13)
编程算法(12)
分布式(10)
linux(9)
yarn(9)
shell(9)
云数据库 SQL Server(8)
kafka(8)
索引(8)
优化(8)
spark(7)
java(6)
react(6)
文件存储(6)
缓存(6)
windows(6)
hbase(6)
性能(6)
python(5)
html(5)
ide(5)
TDSQL MySQL 版(5)
开源(5)
数据分析(5)
产品(5)
工具(5)
架构(5)
内存(5)
javascript(4)
git(4)
jar(4)
网络安全(4)
面向对象编程(4)
数据处理(4)
nat(4)
开发(4)
线程(4)
其他(3)
bash(3)
android(3)
github(3)
http(3)
reactnative(3)
自动化(3)
tcp/ip(3)
https(3)
管理(3)
进程(3)
连接(3)
数据仓库(3)
系统(3)
最佳实践(3)
php(2)
nosql(2)
api(2)
centos(2)
apache(2)
nginx(2)
bash 指令(2)
spring(2)
访问管理(2)
serverless(2)
yum(2)
zookeeper(2)
系统架构(2)
迁移(2)
etl(2)
sqoop(2)
磁盘(2)
服务器(2)
函数(2)
脚本(2)
入门(2)
数组(2)
搜索(2)
统计(2)
费用中心(1)
云服务器(1)
官方文档(1)
机器学习(1)
bootstrap(1)
jquery ui(1)
xml(1)
css(1)
qt(1)
postgresql(1)
打包(1)
maven(1)
unix(1)
容器镜像服务(1)
神经网络(1)
深度学习(1)
专用宿主机(1)
云数据库 MongoDB(1)
消息队列 CMQ 版(1)
腾讯云测试服务(1)
es 2(1)
mongodb(1)
网站(1)
企业(1)
数据安全(1)
electron(1)
容器(1)
运维(1)
压力测试(1)
html5(1)
jdk(1)
ssh(1)
dns(1)
npm(1)
grep(1)
markdown(1)
gradle(1)
安全(1)
虚拟化(1)
实时数仓(1)
Elasticsearch Service(1)
action(1)
app(1)
block(1)
clickhouse(1)
dql(1)
error(1)
exe(1)
greenplum(1)
having(1)
hdfs(1)
message(1)
model(1)
native(1)
partition(1)
range(1)
rows(1)
select(1)
sort(1)
tabbar(1)
title(1)
遍历(1)
操作系统(1)
测试(1)
二维码(1)
高并发(1)
工作(1)
后端(1)
集合(1)
客户端(1)
框架(1)
流量(1)
路由(1)
命令行(1)
模型(1)
排序(1)
摄像头(1)
实践(1)
事务(1)
数据存储(1)
文件上传(1)
效率(1)
消息队列(1)
协程(1)
虚拟机(1)
压缩(1)
原理(1)
字符编码(1)
搜索文章
搜索
搜索
关闭
探索PostgreSQL的多模型世界:灵活存储,无限可能
postgresql
存储
模型
数据
数组
在数据库的世界里,有一种神器,它以其无与伦比的灵活性和强大的功能,赢得了全球开发者的青睐。它就是——PostgreSQL,一个真正的多模型数据库管理系统。
十里桃花舞丶
2024-06-10
156
0
新型数据库技术一览
存储
内存
数据
数据存储
数据库
新型数据库技术是信息技术领域中不断发展和创新的一部分,它们旨在解决传统数据库系统面临的挑战,如大数据量的处理、实时分析、云服务集成、数据安全性和多模型支持等。以下是一些当前备受关注的新型数据库技术:
十里桃花舞丶
2024-06-10
148
0
MySQL一些特殊功能的索引(6/16)
优化
存储
mysql
搜索
索引
创建全文索引的示例: CREATE FULLTEXT INDEX fulltext_index_name ON table_name (column1, column2);
十里桃花舞丶
2024-04-12
87
0
MySQL表空间管理与优化(8/16)
数据
优化
存储
mysql
管理
一个表单独存储为一个文件更容易管理,而且在你不需要这个表的时候,通过 drop table 命令,系统就会直接删除这个文件。而如果是放在共享表空间中,即使表删掉了,空间也是不会回收的。所以参数推荐为ON。
十里桃花舞丶
2024-04-12
152
0
MySQL索引优化方法(1/16)
优化
存储
mysql
数据
索引
主键索引(Primary Key Index):每个表都有一个主键,主键索引是自动创建的唯一索引。它通常是聚簇索引(在索引树的叶子结点中存储的是需要查找的数据)。
十里桃花舞丶
2024-04-12
131
0
MySQL分区表(14/16)
mysql
管理
数据
索引
存储
分区表是数据库中一种用于优化大型表数据管理和查询性能的技术。它将一个表的数据根据特定的规则或条件分割成多个部分,每个部分称为一个分区。每个分区可以独立于其他分区进行存储、管理和查询,这样可以提高数据处理的效率,尤其是在处理大量数据时。
十里桃花舞丶
2024-04-12
131
0
MPP技术的优势与严重缺陷
数据库
存储
架构
数据
数据仓库
MPP代表"Massively Parallel Processing",是一种计算机架构,旨在通过分布式处理来实现大规模数据处理和分析。它使用多个处理器或计算节点同时工作,以加快数据处理速度和提高性能。MPP架构通常用于处理海量数据的应用程序,如数据仓库、商业智能和大数据分析。
十里桃花舞丶
2023-10-16
555
0
大数据常见应用场景及架构改进
存储
分布式
大数据
架构
数据
对于离线场景,最典型的就是数据仓库。它和传统的数仓不太一样。因为传统数仓它只能解决中小规模的数据存储与分析问题。大数据这一块要能承接海量的数据。
十里桃花舞丶
2023-10-16
426
0
转型大数据,要在恰当的时机
存储
大数据
架构
数据
效率
当传统数据存储与处理架构,在数据达到海量以后,产生了存储与性能瓶颈。这个时候大数据出现了,它帮忙解决了数据在海量规模情况下的的存储与计算问题。这是一个技术发展的必要途径,旧的技术无法适应新出现的场景,新技术就要诞生去进行解决。
十里桃花舞丶
2023-10-16
126
0
大数据技术为何诞生,它究竟解决了哪些问题?
数据库
存储
大数据
架构
数据
大数据是什么?其实大数据是满足数据达到海量这个规模以后,对这部分数据要完成存储包括计算的一种技术。
十里桃花舞丶
2023-10-16
498
0
【微话】究竟什么是大数据?
存储
大数据
我认为,大数据是一种在海量数据规模下进行数据存储和计算的一种技术体系(或解决方案)。
十里桃花舞丶
2022-05-10
261
0
【简介】分布式NoSQL数据库
TDSQL MySQL 版
hbase
存储
分布式
数据库
NoSQL是一些分布式非关系型数据库的统称,它采用非关系的数据模型,弱化模式或表结构、弱化完整性约束、弱化甚至取消事务机制,可能无法支持,或不能完整的支持SQL语句。
十里桃花舞丶
2021-12-06
1K
0
【MapReduce】基本原理
mapreduce
大数据
存储
javascript
首先以词频统计的案例,来描述一下MapReduce的运算原理与一些基本的概念。这里输入的数据是一些英文的文章,它有很多行组成,而每一行又包含很多单词,每个单词之间由空格隔开;现在需要使用MapReduce来统计每个单词的出现次数。
十里桃花舞丶
2021-09-10
413
0
【HDFS】系统架构与存储机制
大数据
存储
系统架构
HDFS是主从架构(Master/Slave),当然这也是大数据产品最常见的架构。主节点为NameNode,从节点为DataNode。其中DataNode用于存储数据,存储的数据会被拆分成Block块(默认按照128M进行切分),然后均匀的存放到各个DataNode节点中,为了保证数据安全性,这些Block块会进行多副本的存储,备份到不同的节点。而NameNode则负责管理整个集群,并且存储数据的元数据信息(记录数据被拆分为哪几块,分别存储到了哪个DataNode中)。DataNode会通过心跳机制,与NameNode进行通信(默认3秒),汇报健康状况和存储的Block数据信息,如果NameNode超过一定时间没有收到DataNode发送的心跳信息,则认为DataNode宕机,会启动容灾机制。
十里桃花舞丶
2021-09-10
365
0
Hive权限管控
hive
sql
存储
linux
大数据
一般而言,会推荐使用基于存储的授权和基本标准SQL的授权,来对Hive进行权限管控。
十里桃花舞丶
2021-09-10
783
0
表的高级操作:分桶
编程算法
存储
但和分区不同的是,分区是将表拆分到不同的子目录中进行存储,而分桶是将表拆分到不同文件中进行存储。
十里桃花舞丶
2021-09-10
353
0
表的高级操作:分区
sql
存储
hive
表在存储时,可以进行分区操作,将数据按分区键的列值存储在表目录的子目录中,子目录名=“分区键=键值”。
十里桃花舞丶
2021-09-10
285
0
SQL DDL:存储格式&压缩
存储
hive
python
Hive创建表时默认使用的格式为TextFile,当然内置的存储格式除了TextFile,还有sequencefile、rcfile、ORC、Parquet、Avro。
十里桃花舞丶
2021-09-10
364
0
表存储格式&数据类型
hive
编程算法
存储
文件存储
hadoop
Hive支持的表类型,或者称为存储格式有:TextFile、SequenceFile、RCFile、ORC、Parquet、AVRO。
十里桃花舞丶
2021-09-10
1.7K
0
【单点】每日突破,HBase布隆过滤器
hbase
TDSQL MySQL 版
大数据
编程算法
存储
如果有帮助的,记得点赞、关注。在公众号《数舟》中,可以免费获取专栏《数据仓库》配套的视频课程、大数据集群自动安装脚本,并获取进群交流的途径。
十里桃花舞丶
2021-09-10
712
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档