腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
数据湖
分享有关数据湖、大数据和AI领域的最新洞见和最佳实践
专栏成员
举报
43
文章
69540
阅读量
19
订阅数
订阅专栏
申请加入专栏
全部文章(43)
数据库(11)
sql(11)
大数据(9)
专用宿主机(7)
node.js(6)
hive(6)
kerberos(5)
kafka(5)
云数据库 SQL Server(4)
yarn(4)
hadoop(4)
zookeeper(4)
bash(3)
api(3)
bash 指令(3)
腾讯云测试服务(3)
parcel(3)
spark(3)
tcp/ip(3)
java(2)
python(2)
打包(2)
ide(2)
访问管理(2)
TDSQL MySQL 版(2)
日志数据(2)
存储(2)
缓存(2)
ntp(2)
物联网(2)
hbase(2)
flink(2)
云点播(1)
官方文档(1)
数据挖掘(1)
机器学习(1)
xml(1)
html(1)
json(1)
云数据库 Redis®(1)
github(1)
maven(1)
apache(1)
神经网络(1)
深度学习(1)
mapreduce(1)
文件存储(1)
云数据库 MongoDB(1)
SSL 证书(1)
mongodb(1)
人工智能(1)
http(1)
编程算法(1)
开源(1)
运维(1)
shell(1)
网络安全(1)
jdk(1)
jvm(1)
ssh(1)
yum(1)
rpc(1)
数据分析(1)
云计算(1)
add(1)
datasource(1)
grafana(1)
io(1)
visualization(1)
搜索文章
搜索
搜索
关闭
Flink初试——对接Kafka
flink
kafka
大数据
yarn
数据库
本篇文章我们用 Flink Kafka Connector对接Kafka,实现一个简单的报警业务。我们暂时不去谈论理论,先上手实现这个简单的需求。
soundhearer
2021-01-06
2.1K
0
基于大数据技术的开源在线教育项目 二
sql
api
数据库
云数据库 SQL Server
python
模拟日志的数据格式如下,详细请参见我的开源项目 https://github.com/SoundHearer/kuaiban
soundhearer
2020-12-18
1.3K
0
基于大数据技术的开源在线教育项目 三
ide
云计算
tcp/ip
云点播
本文代码可在开源项目https://github.com/SoundHearer/kuaiban中找到。
soundhearer
2020-12-18
565
0
sparkstreaming遇到的问题
node.js
kafka
spark
zookeeper
这篇文章介绍sparkstreaming对接kafka时遇到的两个offset的问题,首选我们介绍下offset的存储。
soundhearer
2020-12-18
1.5K
0
数据仓库实战 1
文件存储
hadoop
hive
大数据
github
数据仓库(Data Warehouse),是为企业所有决策制定过程,提供所有系统数据支持的战略集合。通过对数据仓库中数据的分析,可以帮助企业改进业务流程,控制成本,提高产品质量等。
soundhearer
2020-12-18
752
0
数据仓库实战 2
网络安全
kafka
大数据
apache
日志数据
首先我们从实时生成的日志文件通过flume采集到kafka中。log日志的格式是app-yyyy-mm-dd.log
soundhearer
2020-12-18
417
0
数据仓库实战 3
hive
bash
bash 指令
经过前面那么久的折腾,我们终于可以切入主题了,接下来我们用数仓分层的理论,在Hive中建立数据仓库。
soundhearer
2020-12-18
1.3K
0
基于大数据技术的开源在线教育项目
spark
python
api
hive
日志数据
毫无疑问最近几年是在线教育和内容付费的风口期,尤其是今年,大量做教育的公司都获得数额不小的投资。我们不是要去追这个风口,而是因为在线教育的成熟,开始产生巨量有价值的数据,率先采用和融合大数据和AI技术的公司,必将强力推动公司的发展,从而转型成为科技公司。
soundhearer
2020-12-18
1.3K
3
数据仓库实战 4
bash 指令
bash
mapreduce
java
专用宿主机
91712 Map-Reduce Framework Map input records=125 Map output records=125 Input split bytes=85 Spilled Records=0 Failed Shuffles=0 Merged Map outputs=0 GC time elapsed (ms)=71 CPU time spent (ms)=1700 Physical memory (bytes) snapshot=259682304 Virtual memory (bytes) snapshot=2850103296 Total committed heap usage (bytes)=235929600 Peak Map Physical memory (bytes)=259682304 Peak Map Virtual memory (bytes)=2850103296 File Input Format Counters Bytes Read=0 File Output Format Counters Bytes Written=2181 20/11/25 11:07:51 INFO mapreduce.ImportJobBase: Transferred 2.1299 KB in 29.0742 seconds (75.0149 bytes/sec) 20/11/25 11:07:51 INFO mapreduce.ImportJobBase: Retrieved 125 records. Warning: /opt/cloudera/parcels/CDH-7.1.3-1.cdh7.1.3.p0.4992530/bin/../lib/sqoop/../accumulo does not exist! Accumulo imports will fail. Please set $ACCUMULO_HOME to the root of your Accumulo installation. SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/opt/cloudera/parcels/CDH-7.1.3-1.cdh7.1.3.p0.4992530/jars/slf4j-log4j12-1.7.30.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: Found binding in [jar:file:/opt/cloudera/parcels/CDH-7.1.3-1.cdh7.1.3.p0.4992530/jars/log4j-slf4j-impl-2.10.0.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation. SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory] 20/11/25 11:07:56 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7.7.1.3.0-100 20/11/25 11:07:56 WARN tool.BaseSqoopTool: Setting your password on the command-line is insecure. Consider using -P instead. 20/11/25 11:07:56 INFO manager.MySQLManager: Preparing to use a MySQL streaming resultset. 20/11/25 11:07:56 INFO tool.CodeGenTool: Beginning code generation 20/11/25 11:07:57 INFO manager.SqlManager: Executing SQL statement: select id, name, category2_id from base_category3 where 1=1 and (1 = 0)
soundhearer
2020-12-18
1.5K
0
深入理解HDFS 一
大数据
node.js
hadoop
Hadoop的发展至今已经有十余年的历史了,其核心设计HDFS和MapReduce,分别解决了海量数据的存储和计算这两个问题。
soundhearer
2020-10-29
903
0
Impala MetaData问题
缓存
html
Impala的核心组件是Impalad,提供查询服务,catalogd缓存和获取元数据,statestored则负责把元数据更新到每个impalad节点上。
soundhearer
2020-10-16
1.4K
0
Ranger同步ldap组问题
访问管理
按照我们之前的配置,在CDH7.1.1上为Ranger集成OpenLDAP认证这边文章中,我们为Ranger集成了OpenLDAP认证,刚开始给Hive、HDFS、HBase授权的时候,没发现有什么毛病,ldap用户都能正常登录和同步。后来使用Ranger API给用户批量授权时,将大量用户放在同一用户组里,比较好管理。这时我们才发现ldap的用户组没有被Ranger同步过来。
soundhearer
2020-10-16
3K
1
Kudu遇到的问题
node.js
shell
大数据
kudu已经集成在了CDP runtime中,安装比较简单,选择master和tablet之后,配置数据目录即可
soundhearer
2020-10-16
2K
0
如何通过Cloudera Manager页面自定义图表
jvm
专用宿主机
在Cloudera Manager中我么可以看到很多图表,CDH的组件如HDFS、HBase等都有大量的描述CPU、磁盘、作业队列等的图表,这些图表可以通过tsquery语句进行构建,tsquery语言是指从Cloudera Manager时间序列数据存储中检索时间序列数据的语句。
soundhearer
2020-10-16
2.3K
0
安装OpenLDAP和客户端
SSL 证书
访问管理
生产环境中CDH集群需要启用安全认证,在CDH7以后,Ranger被替换成了Ranger,因此启用安全认证的步骤包括:集群安装并启用Kerberos,安装OpenLDAP和客户端,集成sssd和SSH,Hive、impala、hue集成LDAP,Ranger集成LDAP,这几个步骤我们分成几篇文章都有详细的操作。
soundhearer
2020-10-16
2.7K
0
MySQL常见问题一
云数据库 SQL Server
数据库
sql
这个错误一般发生在mysql 5.7以及 5.7以上的版本中,其原因是mysql的默认配置中,sql_mode="ONLY_FULL_GROUP_BY" 这个配置严格执行了 'SQL92标准',
soundhearer
2020-10-16
704
0
OpenLDAP集成sssd同步用户并集成SSH登录
存储
ssh
缓存
sssd服务是一个守护进程,该进程可以用来访问多种验证服务器,如LDAP,Kerberos等,并提供授权。SSSD是 介于本地用户和数据存储之间的进程,本地客户端首先连接SSSD,再由SSSD联系外部资源提供者(一台远程服务器) (1)避免了本地每个客户端程序对认证服务器大量连接,所有本地程序仅联系SSSD,由SSSD连接认证服务器或SSSD缓存,有效的降低了负载。 (2)允许离线授权。SSSD可以缓存远程服务器的用户认证身份,这允许在远程认证服务器宕机是,继续成功授权用户访问必要的资源。
soundhearer
2020-10-16
2.9K
0
如何通过Cloudera Manager的API获取集群告警信息
api
专用宿主机
告警监控对于一个集群来说,其重要性不言而喻。Cloudera Manager的告警功能非常详尽,CDH集群出现的异常、故障信息等都会及时地出现在CM页面上,通过页面可以快速方便地了解到集群运行性状况。
soundhearer
2020-10-16
2.7K
0
安装Grafana并使用Cloudera Manager DataSource
add
datasource
grafana
io
visualization
Grafana是一个Go语言编写的开源度量分析与可视化套件,经常被用作基础设施的时间序列数据和应用程序分析的可视化。本文主要讲述如何安装Grafana并使用Cloudera Manager datasource 插件。
soundhearer
2020-10-16
1.1K
0
Hive Impala和Hue集成LDAP
hive
重启之前将身份验证后端修改为desktop.auth.backend.AllowFirstUserDjangoBackend
soundhearer
2020-10-16
2.3K
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档