腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
最新最全的大数据技术体系
专栏作者
举报
717
文章
546588
阅读量
35
订阅数
订阅专栏
申请加入专栏
全部文章(717)
大数据(215)
sql(121)
编程算法(110)
数据库(108)
数据(78)
java(70)
spark(68)
hive(66)
node.js(65)
kafka(51)
hadoop(48)
python(47)
存储(42)
hbase(39)
云数据库 SQL Server(32)
TDSQL MySQL 版(30)
物联网(27)
flink(27)
api(26)
mapreduce(25)
网络安全(25)
linux(24)
网站(24)
数据分析(24)
https(23)
模型(23)
文件存储(22)
apache(21)
yarn(21)
服务(21)
分布式(20)
ide(19)
数据结构(19)
javascript(18)
scala(17)
xml(17)
spring(17)
windows(15)
函数(15)
html(14)
腾讯云测试服务(14)
jar(13)
maven(13)
http(13)
容器(13)
缓存(13)
tcp/ip(13)
数据处理(13)
设计(13)
机器学习(12)
vue.js(12)
基础(12)
配置(12)
语法(11)
bash(10)
容器镜像服务(10)
数据湖(10)
进程(10)
可视化(10)
统计(10)
json(9)
nosql(9)
打包(9)
微服务(9)
pyspark(9)
oracle(8)
shell(8)
面向对象编程(8)
腾讯云开发者社区(8)
tomcat(7)
nginx(7)
消息队列 CMQ 版(7)
yum(7)
jdbc(7)
zookeeper(7)
gpt(7)
编码(7)
博客(7)
公众号(7)
php(6)
bash 指令(6)
推荐系统(6)
微信(6)
云计算(6)
bi(6)
flume(6)
table(6)
测试(6)
工程师(6)
内存(6)
算法(6)
数据接口(6)
对象存储(5)
c++(5)
jsp(5)
unix(5)
人工智能(5)
电商(5)
jdk(5)
mybatis(5)
数据可视化(5)
虚拟化(5)
es(5)
error(5)
openai(5)
工具(5)
全栈(5)
视频(5)
索引(5)
腾讯(5)
系统(5)
原理(5)
字符串(5)
ajax(4)
云数据库 Redis(4)
mvc(4)
git(4)
github(4)
全文检索(4)
深度学习(4)
专用宿主机(4)
访问管理(4)
日志数据(4)
企业(4)
数据安全(4)
hashmap(4)
aop(4)
mysql(4)
部署(4)
服务器(4)
集群(4)
教程(4)
解决方案(4)
入门(4)
事务(4)
线程(4)
AI绘画(4)
其他(3)
servlet(3)
jquery(3)
access(3)
搜索引擎(3)
lucene/solr(3)
神经网络(3)
日志服务(3)
jvm(3)
正则表达式(3)
rpc(3)
sdn(3)
airflow(3)
exception(3)
join(3)
mq(3)
nested(3)
redis(3)
set(3)
shuffle(3)
编程(3)
插件(3)
产品(3)
程序(3)
工作(3)
接口(3)
开发(3)
开发者(3)
连接(3)
排序(3)
同步(3)
需求分析(3)
优化(3)
负载均衡(2)
NLP 服务(2)
自动驾驶(2)
c#(2)
regex(2)
react(2)
css(2)
负载均衡缓存(2)
批量计算(2)
mongodb(2)
serverless(2)
parcel(2)
游戏(2)
开源(2)
自动化(2)
运维(2)
ssh(2)
监督学习(2)
rabbitmq(2)
kernel(2)
spring cloud(2)
安全(2)
机器人(2)
系统架构(2)
mvcc(2)
ascii(2)
sdk(2)
迁移(2)
实时etl(2)
数据库管理(2)
app(2)
break(2)
bug(2)
char(2)
connect(2)
connection(2)
csv(2)
for循环(2)
gateway(2)
host(2)
list(2)
map(2)
null(2)
pandas(2)
pip(2)
process(2)
prompt(2)
pycharm(2)
rdd(2)
select(2)
server(2)
service(2)
truncate(2)
version(2)
video(2)
view(2)
word(2)
百度(2)
变量(2)
编译(2)
对象(2)
多线程(2)
集合(2)
架构(2)
镜像(2)
框架(2)
日志(2)
软件(2)
实践(2)
数据存储(2)
数据类型(2)
图表(2)
微信公众号(2)
性能(2)
异步(2)
源码(2)
费用中心(1)
云服务器(1)
内容分发网络 CDN(1)
ruby(1)
bootstrap(1)
ecmascript(1)
android(1)
eclipse(1)
centos(1)
容器服务(1)
云直播(1)
命令行工具(1)
云推荐引擎(1)
DevOps 解决方案(1)
数据备份(1)
o2o(1)
渲染(1)
vr 视频解决方案(1)
express(1)
kubernetes(1)
压力测试(1)
数据迁移(1)
无人驾驶(1)
wordpress(1)
强化学习(1)
spring boot(1)
线性回归(1)
seo(1)
二叉树(1)
dubbo(1)
jenkins(1)
gradle(1)
scikit-learn(1)
socket编程(1)
lamp(1)
ntp(1)
小程序(1)
网站建设(1)
nat(1)
processing(1)
信息流(1)
任务调度(1)
聚类算法(1)
实时监控(1)
Elasticsearch Service(1)
数据集成(1)
大数据存储(1)
汽车(1)
教育(1)
腾讯云(1)
alias(1)
alpha(1)
amqp(1)
async(1)
backend(1)
between(1)
chatgpt(1)
classnotfoundexception(1)
clickhouse(1)
cloud(1)
cloudera(1)
code(1)
conda(1)
config(1)
core(1)
count(1)
cpu(1)
data(1)
date(1)
default(1)
dll(1)
drawing(1)
ear(1)
echarts(1)
edge(1)
equals(1)
excel(1)
exec(1)
execution(1)
export(1)
field(1)
fifo(1)
function(1)
geo(1)
having(1)
hdfs(1)
hibernate(1)
ibatis(1)
import(1)
insert(1)
int(1)
io(1)
it(1)
jetbrains(1)
jetty(1)
key(1)
matplotlib(1)
model(1)
monitor(1)
partition(1)
path(1)
port(1)
prometheus(1)
ps(1)
regexp(1)
reset(1)
rows(1)
runtimeexception(1)
socket(1)
sqoop(1)
ssl(1)
substr(1)
sys(1)
tampermonkey(1)
target(1)
this(1)
thread(1)
time(1)
timeout(1)
token(1)
txt(1)
types(1)
unique(1)
vim(1)
window(1)
worker(1)
zero(1)
报表(1)
备份(1)
并发(1)
产品经理(1)
程序员(1)
磁盘(1)
代理(1)
登录(1)
递归(1)
地图(1)
队列(1)
多进程(1)
二维码(1)
翻译(1)
分页(1)
高可用(1)
工具类(1)
行业(1)
华为(1)
技巧(1)
监控(1)
脚本(1)
客户端(1)
流量(1)
论文(1)
内核(1)
配色(1)
权限(1)
事件(1)
实时计算(1)
手机(1)
数据仓库(1)
数据同步(1)
数学(1)
数组(1)
搜索(1)
推送(1)
网关(1)
效率(1)
性能监控(1)
虚拟机(1)
异常(1)
域名(1)
在线教育(1)
主机(1)
LLM(1)
搜索文章
搜索
搜索
关闭
下一代实时数据库:Apache Doris 【七】数据模型
数据库
apache
存储
模型
数据
Doris 的数据模型主要分为 3 类:Aggregate 、Uniq 、Duplicate
Maynor
2023-12-20
240
0
下一代实时数据库:Apache Doris 【六】数据划分
数据库
apache
存储
并发
数据
以 AGGREGATE KEY 数据模型为例进行说明。更多数据模型参阅 Doris 数据模型。 列的基本类型, 可以通过在 mysql-client 中执行 HELP CREATE TABLE; 查看。
Maynor
2023-12-19
195
0
手把手做一个公众号GPT智能客服(三)客服消息
存储
gpt
token
公众号
接口
https://developers.weixin.qq.com/doc/offiaccount/Message_Management/Service_Center_messages.html
Maynor
2023-09-28
250
0
下一代实时数据库:Apache Doris 【五】数据表的创建
数据库
apache
存储
排序
数据
一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一
Maynor
2023-09-25
296
0
助力工业物联网,工业大数据之服务域:项目总结【三十九】
存储
大数据
物联网
服务
数据
开启动态分区裁剪:自动在Join时对两边表的数据根据条件进行查询过滤,将过滤后的结果再进行join
Maynor
2023-08-24
181
0
流数据湖平台Apache Paimon(一)概述
apache
存储
数据湖
日志
数据
Flink 社区希望能够将 Flink 的 Streaming 实时计算能力和 Lakehouse 新架构优势进一步结合,推出新一代的 Streaming Lakehouse 技术,促进数据在数据湖上真正实时流动起来,并为用户提供实时离线一体化的开发体验。Flink 社区内部孵化了 Flink Table Store (简称 FTS )子项目,一个真正面向 Streaming 以及 Realtime的数据湖存储项目。2023年3月12日,FTS进入 Apache 软件基金会 (ASF) 的孵化器,改名为 Apache Paimon (incubating)。
Maynor
2023-07-31
1.5K
0
Hudi:数据湖技术引领大数据新风口
存储
大数据
数据湖
数据
索引
Apache Hudi(Hadoop Upserts Delete and Incremental)是下一代流数据湖平台。Apache Hudi将核心仓库和数据库功能直接引入数据湖。Hudi提供了表、事务、高效的upserts/delete、高级索引、流摄取服务、数据集群/压缩优化和并发,同时保持数据的开源文件格式。
Maynor
2023-07-25
440
0
助力工业物联网,工业大数据之分层总体设计【六】
大数据
存储
hive
数据库
sql
Oracle:hostname、port、username、password、sid
Maynor
2023-02-17
465
0
金三银四V2.0之大数据面试常见的10个问题
数据库
数据处理
sql
存储
hive
面试官你好,我是面试咱们公司大数据开发实习岗位的xxx,曾就读于xx学校数据科学与大数据专业,2022年毕业。
Maynor
2023-02-01
795
0
大数据物流项目:Kudu 入门使用(五)
存储
数据处理
数据结构
hbase
TDSQL MySQL 版
KUDU 支持用户对一个表指定一个范围分区规则和多个 Hash 分区规则,如下图:
Maynor
2022-11-30
1.1K
0
Hive的基本知识(一)
存储
hive
hadoop
文件存储
jdbc
💃 Hive架构 📷 💃Hive 组件 用户接口:包括 CLI、JDBC/ODBC、WebGUI。其中,CLI(command line interface)为shell命令行; Hive中的Thrift服务器允许外部客户端通过网络与Hive进行交互,类似于JDBC或ODBC协议。WebGUI是 通过浏览器访问Hive。 元数据存储:通常是存储在关系数据库如 mysql/derby中。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。 Dri
Maynor
2022-05-08
362
0
大数据开发岗面试30天冲刺 - 日积月累,每日五题【Day01】——Hive1
数据库
sql
大数据
hive
存储
Hive 和数据库除了拥有类似的查询语言,再无类似之处。 1)数据存储位置 Hive 存储在 HDFS 。数据库将数据保存在块设备或者本地文件系统中。 2)数据更新 Hive中不建议对数据的改写。而数据库中的数据通常是需要经常进行修改的, 3)执行延迟 Hive 执行延迟较高。数据库的执行延迟较低。当然,这个是有条件的,即数据规模较小,当数据规模大到超过数据库的处理能力的时候,Hive的并行计算显然能体现出优势。 4)数据规模 Hive支持很大规模的数据计算;数据库可以支持的数据规模较小。
Maynor
2022-05-08
309
0
hive 内部表和外部表的区别
大数据
hive
html
存储
未被 external 修饰的是内部表(managed table),被 external 修饰的为外部表 (external table)
Maynor
2022-05-08
710
0
大数据面试题百日更新_Hive专题(Day13)
存储
hive
数据库
sql
云数据库 SQL Server
查询语言不同,传统数据库用的是SQL语句,hive是集成的HQL语句. 数据存储地方不同,不同于传统数据库存储在原始设备或本地文件系统(Raw Device or Local FS),Hive 存储在HDFS. 执行方式不同,传统数据库是Excutor单元执行,hive是MapReduce 同时hive执行延迟高,处理数据规模大,无索引(0.8版本后才加入位图索引,mysql有复杂的索引),都是hive与传统的区别.
Maynor
2022-05-08
235
0
知行大数据分析平台需求说明
数据分析
大数据
存储
尽管学校多年的信息化应用积累了大量的数据,但信息孤岛的壁垒一直没有打破,对这些数据无法进一步的挖掘、分析、加工、整理,不能给学校教育、教学、研发、总务等各方面管理决策提供科学、有效的数据支撑。目前的公司现状:
Maynor
2022-05-03
747
0
大数据繁荣生态圈组件之实时大数据Druid小传(二)Druid架构与原理
数据库
数据结构
sql
存储
索引服务是数据摄入创建和销毁Segment的重要方式,Druid提供一组支持索引服务(Indexing Service)的组件,即Overlord和MiddleManager节点。
Maynor
2022-04-21
538
0
今日指数项目之数据实时业务开发(需求说明)【九】
存储
云计算
秒级行情(Hbase):存储5日内秒级行情,数据量为2.88亿条 分时行情(Druid):存储半年内分时行情数据,数据量为8.64亿条; 历史数据(Hive数仓):以沪深市场2万只证券,存储时间按1年统计: 秒级行情: 210亿条以上 分时行情: 20亿条以上 K线: 1500万条以上
Maynor
2022-04-18
257
0
Mysql高级完整版
全文检索
html
windows
云数据库 SQL Server
存储
1.中央处理器(英文Central Processing Unit,CPU)是一台计算机的运算核心和控制核心。CPU、内部存储器和输入/输出设备是电子计算机三大核心部件。其功能主要是解释计算机指令以及处理计算机软 件中的数据。 CPU核心组件: 1.算术逻辑单元(Arithmetic&logical Unit)是中 央处理器(CPU)的执行单元,是所有中央处理器的核 心组成部分,由"And Gate"(与门) 和"Or Gate"(或门)构成的算术逻辑单元,主要功能是进行二位元的算术运算,如加减乘(不包括整数除法)。 2.PC:负责储存内存地址,该地址指向下一条即将执行的指令,每解释执行完一条指令,pc寄存器的值 就会自动被更新为下一条指令的地址。 3.寄存器(Register)是CPU内部的元件,所以在寄存器之间的数据传送非常快。 用途:1.可将寄存器内的数据执行算术及逻辑运算。 2.存于寄存器内的地址可用来指向内存的某个位置,即寻址。 3.可以用来读写数据到电脑的周边设备。4.Cache:缓存
Maynor
2022-04-15
538
0
今日指数项目之项目介绍和数据采集【四】
windows
存储
数据处理
hive
云数据库 Redis
基于flink实时流计算的,金融证券项目,实时大屏展示,预警模块和离线模块的处理。
Maynor
2022-04-11
480
0
今日指数项目之需求调研【三】
存储
大数据
hadoop
apache
专用宿主机
大数据平台作为底层的基础数据平台,集群规模、计算存储性能将决定流、批的性能指标上限。所以需要考虑整个大数据平台的吞吐量(网络、磁盘IO)、响应速率、计算能力、高并发性、高可用、维护性方便等,以满足多业务场景下,不同应用需求的建设任务,比如多维分析、实时计算、即席查询和数据统计分析等应用功能。 本项目大数据平台在建设过程中,将满足如下性能指标: 批处理部分指标: 支持批处理集群批量总写入速度2GB/秒,批量读取速度300MB/秒; 平台支持并发执行300个查询和200个加载任务; 应用查询时间对于数据库的简单数据读取将不超过1~2秒,三个月统计计算查询时间将不超过15秒,复杂查询时间将不超过1分钟; 复杂批处理任务,ETL的处理时间将不超过2个小时; 实时流处理指标: 平台支持接收峰值为每秒100万条+的流数据; 平台能够在峰值条件下,完成2秒内的实时预警,2秒内完成针对当日数据的查询; 平台每日实时处理模块能够累积处理144亿笔(按4小时交易日保持峰值流速计)订单流数据; 平台支持至少50个并发访问/查询当日数据。 应用响应指标: 数仓应用项目离线报表30秒内完成数据响应查询; 实时大屏数据展示5秒内完成数据响应查询; 应用平台支持并发执行500个用户查询请求;
Maynor
2022-04-11
293
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档