腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Apache Spark与MapReduce
、
、
我一直在查找Spark和MapReduce之间的区别,我真正发现的是Spark在内存和磁盘上运行,这使得它的速度大大加快。但想必,使用Spark,您无论如何都会在内存和磁盘之间移动数据,因此如果内存空间不足,您可以将一些数据移回磁盘,然后引入新数据进行处理。
浏览 0
提问于2018-05-02
得票数 0
2
回答
如何排序和删除重复的URL(文件包含大约100亿个URL)!
、
、
、
正如标题所说,如何对文件进行排序?如果你的PC内存只有2 2GB,但是有100亿个URL (假设最长的URL是256个字符)。
浏览 1
提问于2014-07-18
得票数 0
1
回答
集成了Mongdb,加快了
数据处理
速度
、
Mongodb可以与
hadoop
集成以进行更快的
数据处理
,但在此集成过程中( mongodb ->
hadoop
),数据会从mongodb传输到
hadoop
。问题是,2.数据传输( mongodb ->
hadoop
)是一次性活动吗?如果是,mongodb的后续更新将如何反映在
hadoop
中。
浏览 2
提问于2014-09-01
得票数 3
6
回答
如何搭建
Hadoop
处理环境?
、
、
、
、
Apache
Hadoop
是用于开发在分布式计算环境中执行
数据处理
应用程序的框架。旨在从单个服务器提供存储和计算资源的方式扩展到数千台机器。Apache
Hadoop
的核心部分由存储部分(
Hadoop
分布式文件系统)及其
数据处理
部分(MapReduce)组成。
Hadoop
将文件分割成大块,并将它们分发到群集中的节点上。那么如何搭建
Hadoop
处理环境?
浏览 2083
提问于2018-10-24
1
回答
Hadoop
到底是干什么用的,主要的应用场景和应用领域是什么?
Hadoop
到底是干什么用的,主要的应用场景和应用领域是什么,主要解决的核心问题又是什么,我们个人可以用它来干什么 产生价值呢?
浏览 1000
提问于2020-09-24
1
回答
我的MongoDB需要
Hadoop
吗?
、
、
我听说
Hadoop
是一个很棒的
数据处理
工具,一旦MongoDB连接到,它就可以提高性能。它能很好地处理Map Reduce,但它对我这个不包含任何Map Reduce函数的例子有用吗?此外,如果我在MongoDB中使用Map Reduce并连接
Hadoop
,性能将如何提高?
浏览 0
提问于2014-04-25
得票数 0
2
回答
我们可以使用
Hadoop
MapReduce进行实时
数据处理
吗?
、
、
、
Hadoop
地图-减少和它的回声系统(如蜂巢..)我们通常用于批处理。但是我想知道是否有任何方法可以使用
hadoop
MapReduce作为实时
数据处理
的例子,比如实时结果,实时tweet。如果不是,实时
数据处理
或分析的替代方案是什么?
浏览 0
提问于2018-12-18
得票数 2
回答已采纳
3
回答
Hadoop
是什么?怎么使用呢?
、
听说
Hadoop
是做大数据并行计算的框架,这种跟“云计算“有什么区别?
浏览 763
提问于2017-09-28
1
回答
在Lucene中一起显示同一系列中的文档。
这些文章分几部分编写,例如,我从IBM developer works获得了这些文章: 使用
Hadoop
的分布式
数据处理
,第2部分:更进一步 我将把这三篇文章分别编入索引。
浏览 1
提问于2010-07-18
得票数 2
1
回答
是否有一个可以推送大量数据的框架?
我们的MySQL和
Hadoop
平台部署在不同的网络中,
Hadoop
不能访问MySQL,但是MySQL可以连接到
Hadoop
。顺便说一句,
Hadoop
集群在我们的网络中使用了一个Kafka主题,通过在两边部署水槽并连接在一起。但是对于
海量
的RDS数据,如何实现这一点呢?
浏览 1
提问于2019-02-20
得票数 0
1
回答
在Netty或Mina中支持P2P?
、
、
您好,我是开放的决定,选择Netty或Mina为我的TCP/UDP服务器,我是两个框架的新手,不知道他们中的任何一个支持(S) P2P转换,以便一些
海量
的
数据处理
可以更有效地处理?
浏览 5
提问于2015-06-15
得票数 0
1
回答
使用Python存储和访问大数据
、
我正在考虑将PyTables或MongoDB与PyMongo (或者
Hadoop
-谢谢)一起使用。是否有其他我应该考虑的文件结构/DB? 我要做的一些操作是计算一个点到另一个点的距离。
浏览 5
提问于2012-10-08
得票数 3
回答已采纳
2
回答
用
Hadoop
/ HDInsight替换SAN?
、
Hadoop
更常用于从我从internet.But找到的
海量
数据中查询特定信息。我想探索HDFS,以便能够取代昂贵的SAN。你能提供一些关于这方面的信息,或者是关于这方面的好文章吗?
浏览 1
提问于2013-06-27
得票数 0
2
回答
hadoop
和spark有什么区别?
、
随着see在市场上的增长,我可以看到spark在
Hadoop
上的主要用例如下: 而且处理得很快。 火花会在未来几天取代
Hadoop
吗?当火花并行运行时,
Hadoop
同时工作?(这是真的吗?)
浏览 0
提问于2015-07-08
得票数 3
回答已采纳
6
回答
在apache
hadoop
中执行helloworld.java
、
有人能告诉我如何在apache
hadoop
中执行我的HelloWorld.java吗?
浏览 0
提问于2011-02-02
得票数 0
回答已采纳
1
回答
Hadoop
simple Java程序-与MongoDB交互
我选择
Hadoop
进行
数据处理
,并在我的一个包含大量数据的项目中使用MongoDB进行存储。我配置并安装了
hadoop
,并执行了中给出的示例,该示例具有读取给定文本文档中出现的单词的次数的示例,并且运行良好。但是,当我尝试寻找一个简单的Java示例时,它将连接到MongoDB并执行简单的
数据处理
,例如,表中存储的记录数量属于某个简单条件(name like '%John%')。 有人有什么建议吗?
浏览 1
提问于2013-05-24
得票数 0
回答已采纳
1
回答
Hadoop
和图像的3d渲染
、
、
目标是学习
hadoop
,而不是图像处理。因此,谁能建议我应该使用什么语言,c++或java,以及3d渲染器的一些标准实现。任何其他的帮助都是非常有用的。
浏览 0
提问于2010-09-13
得票数 1
1
回答
如何在现有系统中实现
Hadoop
框架
、
、
、
、
我计划在我的基于web的应用程序中实现
Hadoop
框架。但我只是将其托管在本地主机中。我计划实现mapreduce和hdfs作为分布式文件系统。问题是,我要做的第一步是什么?我应该从什么开始呢?我对
Hadoop
框架进行了深入的研究。了解它是如何工作的,并尝试使用互联网上的wordcount示例。
浏览 2
提问于2015-02-04
得票数 0
6
回答
Apache Storm与
Hadoop
的比较
、
、
Storm与
Hadoop
相比如何?
hadoop
似乎是开源大规模批处理的事实标准,Storm比
Hadoop
有什么优势吗?或者它们是完全不同的?
浏览 1
提问于2012-06-29
得票数 29
回答已采纳
1
回答
类似于SQL表的循环调度,用于跟踪最近的活动
我们需要跟踪不同时间段的用户活动,如24小时,7天等。我们预计不会有很大数量的不同时期,但用户数量将非常大,可能在数百万。每晚cronjob汇总每个用户的统计数据听起来并不合理。我知道过去我曾用RRD表这样跟踪网络使用情况,但这些只是BerkeleyDB的,而且每个统计数据必须有一个文件,这是行不通的,但这个想法似乎是我想要的。有没有我忽略的模式/最佳实践?
浏览 1
提问于2011-12-31
得票数 2
回答已采纳
点击加载更多
相关
资讯
0基础搭建Hadoop大数据处理环境
零基础搭建Hadoop大数据处理环境
从海量数据处理到大数据架构设计思想之-分而治之
Hadoop Hadoop中的推测执行
Hadoop 介绍
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券