首页
学习
活动
专区
工具
TVP
发布

大数据平台TBDS

完全兼容hadoop体系的商业化、完备化和企业化大数据平台
专栏作者
26
文章
146610
阅读量
130
订阅数
TBDS大数据集群使用虚拟机的风险
1、集群整体性能降低。对TBDS产品在同等配置物理机与虚拟机实际的性能测试对比表明,虚拟机整体性能较物理机下降约40%左右;
袁宋
2021-01-13
1.5K1
TBDS-Elasticsearch安全认证配置方法
ES高版本已经支持x-pack认证,TBDS的ES版本是6.4.2,默认已经安装了x-pack,下面是配置方法。
袁宋
2020-12-18
2.7K0
使用mirrormaker工具同步CDH-kafka数据到TBDS-kafka
把CDH集群的kafka数据同步到TBDS的kafka集群做测试,可以使用自带的mirrormaker工具同步
袁宋
2020-12-07
8260
datax工具在TBDS上同步数据方法
因为datax工具本身无法传入认证参数,所以若想在TBDS上使用datax同步数据则需要关闭相应的服务认证。
袁宋
2020-12-07
1.4K0
mysql导入hive的NULL值处理方案
目前提供两种方法解决数据库中的字段值为NULl导入到HIVE中后变成空字符串的方法,使用以下方法可以保障在mysql中存储的是NULL,导入到HIVE表后也是NULL
袁宋
2019-07-02
4.5K0
关注专栏作者,随时接收最新技术干货
mikealzhou
大数据和数据中台架构师
傻二哥
腾讯高级工程师
袁宋
腾讯科技(深圳)有限公司大数据架构师
在TBDS部署sqoop组件及抽取数据至hive的使用方法
导语:本身TBDS平台不提供sqoop组件,若用户想在TBDS平台上使用sqoop抽取外部数据导入至TBDS平台,需要单独部署sqoop组件。
袁宋
2019-07-02
1.9K0
TBDS工作流调度python脚本示例及排错方法
TBDS中的Shell任务工作流可通过shell脚本调用python,也可以直接调用python脚本,以下为两种方法介绍。
袁宋
2019-07-02
2K4
小文件数过多导致distcp迁移报错
DistCp(分布式拷贝)是用于大规模集群内部和集群之间拷贝的工具。 它使用Map/Reduce实现文件分发,错误处理和恢复,以及报告生成。 它把文件和目录的列表作为map任务的输入,每个任务会完成源列表中部分文件的拷贝
袁宋
2019-06-04
2.7K0
TBDS大数据集群迁移实践总结
这次迁移算是TBDS集群的第一次完整迁移案例,包括用户的业务数据,平台应用,从项目启动到最后完成迁移差不多耗费了1个月的时间。
mikealzhou
2018-12-13
3.7K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档