腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
桥路_大数据
专栏成员
举报
183
文章
246664
阅读量
36
订阅数
订阅专栏
申请加入专栏
全部文章(183)
大数据(47)
hive(28)
sql(26)
数据(25)
存储(24)
数据库(20)
hadoop(19)
mapreduce(18)
mysql(16)
node.js(13)
编程算法(12)
分布式(10)
linux(9)
yarn(9)
shell(9)
云数据库 SQL Server(8)
kafka(8)
索引(8)
优化(8)
spark(7)
java(6)
react(6)
文件存储(6)
缓存(6)
windows(6)
hbase(6)
性能(6)
python(5)
html(5)
ide(5)
TDSQL MySQL 版(5)
开源(5)
数据分析(5)
产品(5)
工具(5)
架构(5)
内存(5)
javascript(4)
git(4)
jar(4)
网络安全(4)
面向对象编程(4)
数据处理(4)
nat(4)
开发(4)
线程(4)
其他(3)
bash(3)
android(3)
github(3)
http(3)
reactnative(3)
自动化(3)
tcp/ip(3)
https(3)
管理(3)
进程(3)
连接(3)
数据仓库(3)
系统(3)
最佳实践(3)
php(2)
nosql(2)
api(2)
centos(2)
apache(2)
nginx(2)
bash 指令(2)
spring(2)
访问管理(2)
serverless(2)
yum(2)
zookeeper(2)
系统架构(2)
迁移(2)
etl(2)
sqoop(2)
磁盘(2)
服务器(2)
函数(2)
脚本(2)
入门(2)
数组(2)
搜索(2)
统计(2)
费用中心(1)
云服务器(1)
官方文档(1)
机器学习(1)
bootstrap(1)
jquery ui(1)
xml(1)
css(1)
qt(1)
postgresql(1)
打包(1)
maven(1)
unix(1)
容器镜像服务(1)
神经网络(1)
深度学习(1)
专用宿主机(1)
云数据库 MongoDB(1)
消息队列 CMQ 版(1)
腾讯云测试服务(1)
es 2(1)
mongodb(1)
网站(1)
企业(1)
数据安全(1)
electron(1)
容器(1)
运维(1)
压力测试(1)
html5(1)
jdk(1)
ssh(1)
dns(1)
npm(1)
grep(1)
markdown(1)
gradle(1)
安全(1)
虚拟化(1)
实时数仓(1)
Elasticsearch Service(1)
action(1)
app(1)
block(1)
clickhouse(1)
dql(1)
error(1)
exe(1)
greenplum(1)
having(1)
hdfs(1)
message(1)
model(1)
native(1)
partition(1)
range(1)
rows(1)
select(1)
sort(1)
tabbar(1)
title(1)
遍历(1)
操作系统(1)
测试(1)
二维码(1)
高并发(1)
工作(1)
后端(1)
集合(1)
客户端(1)
框架(1)
流量(1)
路由(1)
命令行(1)
模型(1)
排序(1)
摄像头(1)
实践(1)
事务(1)
数据存储(1)
文件上传(1)
效率(1)
消息队列(1)
协程(1)
虚拟机(1)
压缩(1)
原理(1)
字符编码(1)
搜索文章
搜索
搜索
关闭
用户自定义函数UDTF
编程算法
Hive UDTF只有一种实现方式,需要继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF类,并重写initialize, process, close三个方法。
十里桃花舞丶
2021-09-10
440
0
表的高级操作:分桶
编程算法
存储
但和分区不同的是,分区是将表拆分到不同的子目录中进行存储,而分桶是将表拆分到不同文件中进行存储。
十里桃花舞丶
2021-09-10
353
0
表存储格式&数据类型
hive
编程算法
存储
文件存储
hadoop
Hive支持的表类型,或者称为存储格式有:TextFile、SequenceFile、RCFile、ORC、Parquet、AVRO。
十里桃花舞丶
2021-09-10
1.7K
0
【单点】每日突破,MapReduce分区
大数据
编程算法
mapreduce
http
问:MapReduce在进行HashPartitoner时,会获取key的hashCode,之后为什么要与Integer.MAX_VALUE进行逻辑与计算?
十里桃花舞丶
2021-09-10
213
0
【单点】每日突破,HBase布隆过滤器
hbase
TDSQL MySQL 版
大数据
编程算法
存储
如果有帮助的,记得点赞、关注。在公众号《数舟》中,可以免费获取专栏《数据仓库》配套的视频课程、大数据集群自动安装脚本,并获取进群交流的途径。
十里桃花舞丶
2021-09-10
714
0
【小技巧】Shell批量处理报错信息,检测本地jar包是否存在
编程算法
shell
jar
抛出了一堆使用冒号分割的jar包字符串。当然实际报错的jar包数量更多,这里截取了一部分。
十里桃花舞丶
2021-01-07
616
0
Hive分桶一文读懂
编程算法
存储
mapreduce
大数据
但和分区不同的是,分区是将表拆分到不同的子目录中进行存储,而分桶是将表拆分到不同文件中进行存储。
十里桃花舞丶
2021-01-06
1.9K
0
数据脱敏?Hive一个函数搞定
编程算法
tcp/ip
Hive在2.1.0版本后,支持数据屏蔽函数(Data Masking Functions),可以用于数据的快速掩码处理(脱敏)。
十里桃花舞丶
2021-01-06
2K
0
windows自动化批处理删除文件
编程算法
最近发现某软件删除某几个文件夹之后,就可以再次免费试用,但试用期结束之后需要再次重复删除。于是想到了批处理命令,大家可以创建txt文件,然后编辑命令后将文件后缀改成bat,然后双击运行即可完成批量删除操作。下面给大家讲解一下我查到和实验的结果。
十里桃花舞丶
2019-02-20
1.8K
0
C++错误解决:double free or corruption (out): 0x00000000011abe70 ***
编程算法
博主最近疯狂的迷恋上了leetcode刷题,想要锻炼脑力和算法思想的,推荐去这个网站上刷题。因为是用c++编写的,而且提交的时候会经常遇到一些报错。比如题目的这个。好了,下面开始解答。
十里桃花舞丶
2019-02-20
6.6K
0
思维导图版Python3入门与进阶(一)基本数据类型
编程算法
自己也是在摸打滚爬中在慢慢的学习python3这门语言,之前是java开发,到后来转向python的学习,因为python语言对于数据处理方面还是异常强大。学习语言,自己的心得还是要多实践,最好是先打好基础,然后自己尝试着拿来使用,变成自己的东西才是最重要的。话不多说,这个专题会把自己学习python3的笔记和心得分享给大家。与大家共勉。
十里桃花舞丶
2019-02-20
591
0
多云服务器kafka环境搭建并接收flume日志数据
kafka
zookeeper
专用宿主机
html5
编程算法
前言 如果看过博主之前的文章,也可以了解到我正在搭建一个大数据的集群,所以花了血本弄了几台服务器。终于在flume将日志收集到日志主控flume节点上后,下一步要进行消息队列的搭建了。中间遇到过很多坎坷和坑,下面就为大家讲解一下搭建过程和注意事项,最终的成果是kafka搭建成功并接受flume主控传来的数据。 环境 服务器:CentOS7.2 JDK: jdk1.8.0_161 flume: apache-flume-1.6.0-cdh5.7.0 zookeeper: zookeeper-3.4.5-cdh
十里桃花舞丶
2018-05-17
1.2K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档