腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Amazon
Elastic
MapReduce
-
python
地图
和
reduce
代码
的
格式
或
示例
python
、
hadoop
、
mapreduce
、
amazon-emr
、
elastic-map-reduce
也许Hadoop也是如此,但我只是找不到编写地图
的
格式
或
示例
,并在地图
示例
旁边减少
python
代码
:
和
Hadoop是一样
的
吗?
格式
是什么,有没有什么例子?
浏览 1
提问于2011-06-30
得票数 2
回答已采纳
2
回答
是否可以在Hadoop 0.20中使用Avro?
api
、
hadoop
、
hdfs
我对使用Avro从Hadoop HDFS保存
和
读取文件很感兴趣,我在Hadoop问题跟踪器中看到了一些关于实现对Avro
的
支持
的
Jira,但没有关于如何在Hadoop中启用Avro支持
的
示例
。此外,我也不能完全确定当前
的
0.20版本是否支持Avro,因为一些Jira版本已经关闭了0.21版本。有没有可能获得最新
的
0.21并以某种方式结束打开Avro并使用它?
浏览 2
提问于2010-06-28
得票数 0
1
回答
如何从
Python
中为runner指定输入文件?
python
、
mapreduce
、
mrjob
我正在编写一个外部脚本,以便在我
的
笔记本电脑上(不是在
Amazon
Elastic
Compute Cloud
或
任何大型集群上)通过
Python
mrjob模块运行
mapreduce
作业。我从上了解到,我应该使用MRJob.make_runner()从单独
的
python
脚本运行
mapreduce
作业,如下所示。但是,我如何指定要使用
的
输入文件?我想使用与
mapreduce
脚本
和
运行
浏览 0
提问于2012-09-25
得票数 6
回答已采纳
4
回答
是否可以使用.NET为亚马逊弹性
MapReduce
编写
map
/
reduce
作业?
.net
、
amazon-ec2
、
mapreduce
是否可以使用.NET语言为
Amazon
Elastic
MapReduce
()编写
map
/
reduce
作业?特别是,我想使用C#。 初步研究表明并非如此。上述网址
的
营销文本建议您可以“选择Java、Ruby、Perl、
Python
、PHP
或
C++",而无需提及.NET语言。这个亚马逊线程( --“支持C# / F#映射/缩减”)明确表示“目前
Amazon
Elastic
<e
浏览 4
提问于2009-07-27
得票数 13
回答已采纳
2
回答
如何在
Amazon
EMR上配置Hadoop参数?
hadoop
、
amazon-web-services
、
hadoop2
、
emr
、
amazon-emr
我在
Amazon
上使用one Master
和
two slavers运行了一个MR作业,但收到了很多错误消息,比如
map
100%
reduce
35%之后
的
running beyond physicalKilling container 我修改了我
的
代码
,在Hadoop2.6.0 MR配置中添加了以下几行,但我仍然得到相同
的
错误消息。conf.set("
mapreduce
.
reduce
.memory.mb&
浏览 4
提问于2015-11-10
得票数 3
1
回答
如何使用红移查询S3公共数据集
mysql
、
amazon-web-services
、
amazon-s3
Amazon
AWS文档非常糟糕,完全没有帮助。感觉很好,现在我们可以开始讨论实际问题了。我正在使用SQL工作台连接到我
的
redshift集群,我可以正常连接,但不能运行任何命令…… 如何查询常见
的
爬网s3数据集?
浏览 0
提问于2015-06-30
得票数 0
1
回答
Hadoop入门
的
最简单方法
hadoop
、
elastic-map-reduce
我正在寻找提交
MapReduce
作业
的
最简单方法。 我正在寻找一个在复杂性(
或
简单性)方面类似的平台,这样
的
Heroku (是给Ruby)
或
picloud.com是地图。在这个想法中,初学者可以提交
MapReduce
作业,而不必处理设置Hadoop集群
的
复杂性。
Elastic
Map
Reduce
很接近,但设置实例
的
启动时间却很慢。所以基本上我在找一个做过类似
MapReduce
<e
浏览 2
提问于2012-11-03
得票数 1
回答已采纳
3
回答
Amazon
云实例之间
的
Python
多处理
python
、
amazon-ec2
、
multiprocessing
、
python-multithreading
我希望在一些亚马逊EC2实例上运行一个长时间运行
的
python
分析流程。
代码
已经使用
python
multiprocessing模块运行,并且可以利用单个机器上
的
所有内核。分析是完全并行
的
,每个实例都不需要与其他任何实例通信。所有的工作都是“基于文件
的
”,每个进程独立地处理每个文件……因此,我计划在所有节点上装载相同
的
S3卷。我想知道是否有人知道设置多处理环境
的
任何教程(或有任何建议),以便我可以在任意数量
的
计算实例
浏览 2
提问于2011-06-24
得票数 4
回答已采纳
2
回答
Hadoop/
Elastic
Map
Reduce
与二进制可执行文件?
python
、
matlab
、
amazon-web-services
、
hadoop
、
mapreduce
我正在使用hadoop streaming、
python
、matlab
和
elastic
map
reduce
编写分布式图像处理应用程序。我已经使用matlab编译器编译了我
的
matlab
代码
的
二进制可执行文件。我想知道如何将它合并到我
的
工作流程中,这样二进制文件就成为
Amazon
的
弹性地图
reduce
处理
的
一部分?
代码
非常复杂(不是我写
的
浏览 3
提问于2010-11-05
得票数 1
3
回答
试图在MongoDB
MapReduce
调用中包含查询
c#
、
mongodb
、
mapreduce
我正在尝试创建一个非常基本
的
map
--
reduce
示例
,该
示例
还在
MapReduce
api调用中集成了一个查询。我
的
集合有很多条目,
格式
如下: "firstname(
map
,
浏览 3
提问于2011-04-05
得票数 5
回答已采纳
1
回答
MapReduce
未排序
python
、
sorting
、
mapreduce
当我通过命令行使用
map
.py
和
reduce
.py时,我正在使用
python
开发一个
mapreduce
程序:结果是好
的
。passengers.dat -output /out -file
map
.py -file
reduce
.py -mapper <
浏览 4
提问于2014-11-06
得票数 2
1
回答
以文件名为关键字,以内容为值
的
MapReduce
,许多小文件
java
、
hadoop
、
elastic-map-reduce
我看过、
和
,但我在起步时遇到了麻烦。我以前没有使用Hadoop做过任何事情,所以如果别人看到我犯了错误,我会小心地从错误
的
方向开始。我有一个目录,其中包含大约100K
的
小文件,其中包含超文本标记语言,我想使用
Amazon
Elastic
MapReduce
创建一个倒排索引,用Java语言实现。一旦我有了文件内容,我就知道我想让
map
和
reduce
函数做什么了。 看过之后,我
的
理解是我需要继承FileInputForm
浏览 1
提问于2015-12-07
得票数 0
1
回答
我应该在哪里写
mapreduce
程序
mapreduce
、
elastic-map-reduce
我应该在哪里写
map
-
reduce
程序-在文本文件
或
任何其他文件中?在java中,文本文件,将java
代码
保存为filename.java,但对
map
-
reduce
程序将是什么呢? 因为我非常需要,所以请回答。
浏览 1
提问于2013-03-23
得票数 0
3
回答
mapReduce
模式
的
最好
的
python
实现是什么?
python
、
mapreduce
什么是最好
的
MapReduce
实现,一个框架
或
一个库,可能
和
Apache hadoop one一样好,但如果它是用
Python
语言编写
的
,最好是文档良好且易于理解,完全实现为
MapReduce
模式,高可伸缩性,高稳定性
和
轻量级。我在谷歌上搜索了一个叫mincemeat
的
,不太确定,但还有其他人很出名吗? 谢谢
浏览 2
提问于2011-09-01
得票数 4
1
回答
我可以用不同
的
语言编写映射器
和
归约器程序吗
perl
、
python-3.x
、
mapreduce
、
elastic-map-reduce
我感觉在Perl脚本中执行Mapper操作,但后来我意识到用
Python
编写Reducer会更容易。Mapper
和
Reducer可以在不同
的
编程语言中工作吗?
浏览 0
提问于2013-09-15
得票数 1
2
回答
Hadoop Containder
的
运行超出了物理内存限制。
hadoop
我还是有错误
的
。我当前
的
mapred-site.xml文件如下:<property> <value>yarn</value><property> <name>
mapreduce
.
map
.java.opts</
浏览 1
提问于2017-05-01
得票数 0
回答已采纳
1
回答
EMR - Hive
和
Java
的
结合
java
、
hive
、
emr
我使用
的
是
Amazon
Elastic
-
Map
-
Reduce
。是否可以运行使用java
代码
的
配置单元查询(使用转换功能)?当我创建一个新
的
作业流时,我需要在一个自定义jar
和
一个配置单元程序之间进行选择,而我同时需要这两个程序... 感谢大家
的
支持!
浏览 0
提问于2012-07-29
得票数 1
2
回答
如何使用
Amazon
的
EMR在CLI中指定带有自定义jar
的
映射配置& java选项?
java
、
hadoop
、
mapreduce
、
elastic-map-reduce
、
emr
我想知道如何在使用自定义jar运行流作业时指定
mapreduce
配置,例如mapred.task.timeout、mapred.min.split.size等。当我们使用外部脚本语言(如ruby
或
python
)运行时,我们可以使用以下方式指定这些配置:我尝试了以下几种方法,但都没有奏效: jar S3://somepathinput -arg s3://somepath/output -args -m,mapred.min.split.size=528
浏览 3
提问于2012-02-14
得票数 7
回答已采纳
1
回答
如果数据对于1个减速器(RHadoop)来说变得很大,该怎么办?
r
、
hadoop
、
mapreduce
、
rhadoop
我是大数据
和
hadoop
的
新手。我试着用
mapreduce
找到中位数。据我所知,映射器将数据传递给1个reducer,然后1个reducer使用median()函数排序并找到中间值。R在内存中运行,那么如果数据太大而无法存储在一台计算机上运行
的
一个reducer中怎么办? 以下是我使用RHadoop查找median
的
代码
示例
。
map
<- function(k,v) { k
浏览 15
提问于2019-12-23
得票数 1
1
回答
在EC2上运行
mapreduce
作业时如何获取文件名?
python
、
amazon-ec2
、
mapreduce
、
amazon-emr
我正在学习
elastic
mapreduce
,并从
Amazon
教程部分提供
的
Word Splitter
示例
开始(
代码
如下所示)。该
示例
为提供
的
所有输入文档中
的
所有单词生成字数统计。但是我想通过文件名得到字数统计
的
输出,也就是一个特定文档中
的
字数。由于字数统计
的
python
代码
接受来自stdin
的
输入,我如何辨别哪个输入行来自哪个
浏览 2
提问于2011-11-10
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券