腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Hadoop
初学者
-
数据
摄取
和
分析
、
、
HDFS存储结构化
和
非结构化的data.HIVE & IMPALA使我们能够编写sql查询,然后将这些查询转换为MapReduce。用户如何知道存储
数据
的模式,或者这些表是如何从存储在HDFS中的
数据
形成的?
浏览 16
提问于2017-12-18
得票数 1
1
回答
使用Elasticsearch作为主
数据
库而不是MongoDB的方案
、
我们目前正在为我们的一个“大规模
数据
”产品使用MongoDB。简单来说,我们使用Mongo来存储大量的社交媒体
数据
,比如tweet/post/hashtag等等。因此,使用案例是社交媒体
分析
。到目前为止,我们使用MongoDB面临的唯一问题是全文搜索能力
和
聚合性能。 文档的数量将在2500万左右,我们将在单个实例上使用此数量。此外,我们的大多数
分析
都是在整个集合上进行的(我们通常没有太多过滤器来减少
分析
数据
集)。最近,我们开始关注Elastic Se
浏览 0
提问于2016-07-26
得票数 2
1
回答
Spring XD是正确的工具选择吗?
、
、
我们正在构建一个M2M IoT平台,生态系统的一部分是大
数据
存储
和
分析
组件。在我看来,Spring XD似乎能够协调这一过程,从
摄取
、过滤、处理、
分析
到导出到
Hadoop
。
浏览 1
提问于2014-05-02
得票数 0
3
回答
蜂巢中的行格式服务器
、
我使用
Hadoop
2.0.4并从事twitter情绪
分析
。我曾经用水槽
摄取
数据
,但现在twitter
数据
必须存储在蜂巢表中。 我已经创建了一个表,但是行格式SERDE出现了错误。
浏览 5
提问于2015-07-24
得票数 2
2
回答
Bigdata用例
、
、
、
目前
数据
是在SQLServer中处理的,而前端则是在MVC中。由于使用SQLServer本身进行
分析
的
数据
流非常高,因此决定使用BigData。我选择了Cloudera Manager CDH,SQOOP将
数据
从SQLServer导入到配置单元,并使用IMPALA运行
分析
。
浏览 4
提问于2015-11-21
得票数 0
2
回答
Apache Flume简介
在BigData
分析
的哪个阶段使用?请 正如你对非技术人员所解释的
浏览 0
提问于2016-01-11
得票数 4
2
回答
这是否是非侵入性的?
、
、
我想尝试apache flink、
hadoop
和
solr来进行非侵入性的日志
摄取
,以便对它们进行处理
和
索引,并进行一些
分析
和
查询。我在考虑使用flink对几个应用程序的应用程序日志进行
数据
处理,然后将它们放到
hadoop
上,然后使用solr对它们进行查询。问题是:这真的是非侵入性的吗?Flink的行为类似于flume,在我喜欢监视的服务器中安装
和
配置代理。
hadoop
和
solr是不是一个很好的组合,
浏览 21
提问于2019-04-11
得票数 0
1
回答
hdfs
和
hive有什么关系?
、
我有psudeo分布式
hadoop
环境,并使用sqoop
和
hive进行
数据
导入
和
分析
。我使用sqoop将
数据
从mysql导入到蜂箱中,它起作用了,我在我的蜂巢位置(也就是/user/hive/warehouse/ )获得了
数据
,我可以在hive表中看到
数据
。我的怀疑是: 当我从mysql导入到hive(构建在
hadoop
之上)时,
hadoop
中存储的
数据
会
浏览 5
提问于2017-01-11
得票数 0
1
回答
ElasticSeach从Apache
Hadoop
读取
数据
、
我们正在尝试将Elasticsearch应用到我们的大
数据
环境中。目前我们运行的是Apache
Hadoop
2.7,包括Hive
和
Spark。在
Hadoop
中以Parquest格式存储
数据
。当我们在我们的环境中实施ELK时,我们只能将
数据
存储到
Hadoop
HDFS中吗?或者,我们必须从
Hadoop
中提取
数据
并导入到Elasticsearch中,以便创建索引,但我们在系统中有重复的
数据
集(
Hadoop</e
浏览 0
提问于2020-06-14
得票数 1
4
回答
Flume
和
Sqoop有什么不同?
、
、
Flume
和
Sqoop都是用于
数据
移动的,那么它们之间的区别是什么呢?在什么情况下应该使用Flume或Sqoop?
浏览 133
提问于2013-10-22
得票数 22
回答已采纳
1
回答
为静态时间序列
数据
选择存储层
、
、
、
、
总的来说,我是大
数据
技术堆栈的新手。我正在实施一个实时
分析
基础设施,它将从我们的微服务后端的不同服务中
摄取
高容量/高速度的
数据
。
摄取
的
数据
(和
数据
流)将用于填充关键业务指标的仪表板,以及用于BI查询
和
机器学习。现在,我正在研究在哪里存储静态
数据</em
浏览 0
提问于2016-06-09
得票数 2
1
回答
在Hive中使用kafka
和
不使用kafka进行
分析
的流式推文
、
、
、
、
我想做一个项目,我在蜂巢中流式传输一些推文来
分析
它们,所有这些过程都必须在HDF/NiFi中完成。该项目必须是可伸缩的。我在Cloudera网站上看到,人们采用了两种不同的流程策略师。1.)获取推文->将它们放入HDFS ->使用配置单元
分析
所以
浏览 4
提问于2020-03-06
得票数 0
2
回答
跨各种属性聚合的最佳技术栈
、
、
、
、
流
数据
被输入到流中的系统。我们正在考虑打破时间桶(例如5分钟)中的流
数据
,并根据不同的属性预计算各种聚合,并将聚合存储在DynamoDB中以服务查询。关于这一点,我们正在评估以下备选方案: 如果有人使用过类似的用例或使用过上述任何技术,请让我知道哪种方法最适合我们的用例。
浏览 4
提问于2013-03-13
得票数 0
回答已采纳
2
回答
Hadoop
数据
摄取
、
、
、
我有以下要求:对于这个问题语句,我们计划有一个
数据
库轮询器来轮询键条目。在读取该条目之后,我们需要从Oracle表中
摄取
数据
。对于这种
摄取
目的,哪种工具是最好的?此外,我们还需
浏览 0
提问于2016-11-17
得票数 2
1
回答
如何在Azure
数据
资源管理器中查询日志
分析
数据
?
、
我需要在Azure
数据
资源管理器中查询我的Log Analytics工作区,但我对此一无所知。 以下是我的疑问? 1.在使用
数据
之前,我是否需要从日志
分析
向Azure
数据
资源管理器注入
数据
?2.我找不到任何方法将日志
分析
连接到Azure
数据
资源管理器? 3.我看到在Azure
数据
资源管理器中注入
数据
的唯一选项是通过事件中心。但现在我的问题是,我如何使用事件中心将日志
分析
数据
摄取
到A
浏览 1
提问于2018-11-22
得票数 0
2
回答
crawler + elasticsearch集成
、
、
、
我不能找出,如何抓取网站
和
索引
数据
到elasticsearch。我设法在组合nutch+solr中做到了这一点,并且由于nutch应该能够从1.8版导出
数据
直接到elasticsearch (),所以我再次尝试使用nutch。然而,我并没有成功。
浏览 0
提问于2014-11-26
得票数 2
回答已采纳
1
回答
利用kafka从爬虫中
摄取
数据
、
、
、
我试着
和
Kafka合作来
摄取
数据
,但是我对此还不熟悉,我有点困惑,我有多个爬虫,他们从web平台上为我提取
数据
。现在的问题是,我想
摄取
使用Kafka将
数据
提取到
Hadoop
而没有任何中间脚本/服务文件的内容。有可能吗?
浏览 0
提问于2018-08-16
得票数 1
回答已采纳
1
回答
阿帕奇水槽
和
阿帕奇风暴有什么区别?
、
、
、
阿帕奇水槽
和
阿帕奇风暴有什么区别? 两者都是用来传输
数据
的,所以风暴可以作为水槽的替代品吗?
浏览 0
提问于2017-11-03
得票数 6
回答已采纳
1
回答
IIS日志实时直连到
Hadoop
、
、
、
我正在尝试在
Hadoop
中为日志聚合做一个POC。我们有多个IIS服务器托管至少100个站点。我想要连续地将日志流式传输到HDFS,并解析
数据
并存储在Hive中以供进一步
分析
。1) Apache KAFKA或Apache Flume是正确的选择请提供任何建议,以及此类问题陈述的任何信息。 谢谢
浏览 1
提问于2016-11-10
得票数 0
1
回答
德鲁伊镶木地板
摄取
性能差
、
、
、
、
当使用镶木地板
数据
时,德鲁伊
摄取
缓慢有什么原因吗?我们观察到,当JSON
数据
被
摄取
时,
摄取
速度至少要快2倍。一般来说,哪一个更好?在Druid
Hadoop
批处理
摄取
的上下文中使用JSON或Parquet。
浏览 15
提问于2019-02-08
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
后 Hadoop 时代,大数据分析路在何方?
大数据平台搭建:基于Hadoop的数据分析平台
一文了解大数据分析利器——Hadoop
大数据hadoop和spark有什么区别?内附大数据Spark+Hadoop资料
数据分析——SQL初学者入门手册2
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券