腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Hadoop
中
MapReduce
作业
的
不带
附加
文件
的
输出
、
如果
输出
存储库
中
没有额外
的
_SUCCESS
文件
,如何从
MapReduce
作业
生成
输出
?
浏览 3
提问于2018-01-12
得票数 0
1
回答
在
hadoop
迭代
作业
中将相同
的
字符串(先前
的
结果)
附加
到每个拆分
的
mapreduce
输入
文件
上
、
、
我是
Hadoop
的
新手,我正在编写一个迭代
的
MapReduce
作业
。 我知道,使用
Hadoop
,从一个大数据集开始,它将被拆分为小
文件
,而不是将它们作为输入发送到不同机器上
的
映射函数。我只是成功地在
输出
文件
的
末尾
附加
了
MapReduce
的
结果,但是这样,通过迭代
作业
,这个结果将只发送到一台机器上。因此,我希望将结果
附加<
浏览 1
提问于2014-05-26
得票数 0
回答已采纳
2
回答
在
mapreduce
中
解析.json
文件
、
、
我是
hadoop
上
的
json新手,我有大量
的
.json类型
的
日志
文件
。我需要在
mapreduce
中
解析这些日志。我需要
的
mapreduce
作业
的
例子,采取.json
文件
的
输入,解析它,并
输出
到一个文本
文件
或.json
文件
。":[
浏览 0
提问于2015-06-04
得票数 0
1
回答
Google云上dataproc gui版本
中
的
Hadoop
作业
错误
、
我试图使用org.apache.
hadoop
.examples.WordCount为wordcount创建一个
作业
,但它显示了错误:使用
的
职务配置:
文件
存储在桶
中
:
hadoop
-
mapreduce
-ex
浏览 1
提问于2021-02-10
得票数 1
回答已采纳
1
回答
带有HAR
文件
输出
的
MapReduce
作业
、
、
、
我有多个小输入
文件
。对于使用多个输入
文件
运行映射减少
作业
,以下命令如下所示:但是,如果上面仅仅是一个文本
文件
,并且应该是一个HAR
文件
,那么
MapReduce
作业
的
所有
输出
都是一个HAR存档
的
命令是什么呢?
浏览 7
提问于2015-12-16
得票数 1
回答已采纳
1
回答
是否对map-reduce操作
的
最终结果进行了索引?
我正在尝试找出如何迭代map reduce操作
的
最终结果,所以我猜map reduce结果中一定有某种索引?
浏览 4
提问于2010-03-11
得票数 0
回答已采纳
1
回答
在环境中使用
Hadoop
流运行python映射减少
作业
时出错
、
、
、
我想使用
hadoop
流方法在
中
运行python映射减少
作业
。我
的
地图减少python脚本、输入
文件
和
作业
结果
输出
都位于
中
。我试着运行这个命令
hadoop
jar /usr/lib/
hadoop
-
mapreduce
/
hadoop
-streaming.jar -file gs://bucket-name/intro
浏览 1
提问于2017-12-28
得票数 2
回答已采纳
3
回答
如何在不使用repartition和copyMerge
的
情况下合并spark结果
文件
?
、
、
我使用下面的代码:pathToResults目录下有很多
文件
,比如part-0000,part我可以使用FileUtil.copyMerge(),但它真的很慢,它下载所有的
文件
到驱动程序,然后上传到
hadoop
.但是FileUtil.copyMerge()比:如何在不使用repartition和
浏览 0
提问于2015-03-13
得票数 7
回答已采纳
1
回答
尝试使用Jdbc访问配置单元表时出错
、
、
我需要写一个API来从Hive表
中
获取数据,这样我就可以处理它了,所以我正在尝试使用Jdbc访问Hive表。一个简单
的
"Select * from table“可以很好地工作,但是"Select count(*) from table”抛出了一个错误: 2017-04-20 18:05:57,709 INFOjava.sql.SQLException: Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.
h
浏览 4
提问于2017-04-20
得票数 0
2
回答
Hadoop
看不到我
的
输入目录。
、
、
、
我遵循
的
是,我正在分配输入和
输出
目录。我在这里创建了两个目录:~/projects/
hadoop
/WordCount/output/找到我
的<
浏览 4
提问于2017-02-03
得票数 0
回答已采纳
1
回答
Hadoop
Map-Reduce
输出
文件
异常
、
、
、
我在亚马逊d2.2Xlarge上运行单节点
hadoop
集群时出现此错误。我也无法查看我
的
output.Can。谁能提供正确
的
步骤来解决此问题?for output/file.out"bin/
hadoop
fs -mkdir /output bin/hdfs dfsadmin -safemode leavebin/<em
浏览 2
提问于2016-03-03
得票数 2
2
回答
如果没有本地
文件
系统
的
帮助,如何将HDFS
中
的
多个
文件
附加
到HDFS
中
的
单个
文件
中
?
、
我在学
hadoop
。我现在遇到了一个问题。我运行
mapreduce
作业
,
输出
存储在多个
文件
中
,但不是单个
文件
。我想将它们全部添加到hdfs
中
的
单个
文件
中
。有没有办法在不接触本地
文件
系统
的
情况下将HDFS
中
的
输出
文件
附加
到HDFS
中
的
单个<e
浏览 6
提问于2019-11-29
得票数 0
3
回答
运行
hadoop
时磁盘已满
、
、
有些地方出了问题,它几乎消耗了C驱动器中所有可用
的
磁盘空间。因此,我关闭了资源管理器、节点管理器、名称Node、数据节点控制台。现在我有一个C驱动器,它几乎已经满了,我不知道如何清空磁盘空间,并使我
的
C驱动器像以前一样。我现在该怎么办。任何帮助都是非常感谢
的
。
浏览 7
提问于2015-04-17
得票数 0
2
回答
猪究竟什么时候使用
Hadoop
MapReduce
环境?
、
、
我对
Hadoop
Mapreduce
和Pig环境有疑问。在
中
,我发现Pig系统对Pig
的
拉丁代码很感兴趣。首先,我认为Pig使用map和reduce方法创建.jar
文件
,然后将该
文件
“发送”到
Hadoop
Mapreduce
环境以运行
mapreduce
作业
(这是Pig开发人员未来
的
工作)。那么,Pig系统到底什么时候使用
Hadoop
Mapreduce
呢?它是在解
浏览 0
提问于2012-08-30
得票数 2
回答已采纳
0
回答
禁止命令行
输出
hadoop
fs命令
、
、
、
我正在使用Python程序运行
hadoop
mapreduce
作业
,该程序创建不同
的
输入路径作为
mapreduce
作业
的
参数。在将这些输入路径传递到
mapreduce
之前,我目前正在使用以下命令检查
hadoop
fs路径是否存在:然后,我
的
Python程序与命令行通信并确定
文件
是否存在(如果
文
浏览 6
提问于2017-06-13
得票数 0
回答已采纳
1
回答
:当我指定多个还原器时,最终
的
hdfs结果
文件
在哪里?
、
、
、
然后我编译并运行它:它运行良好,当我检查
输出
目录时:output-18/part-00011output-18/part-00013好
的
,15台减速机应该生产15部分-xxxx,正如我所预期
的
。但是,合并所有这
浏览 0
提问于2018-08-26
得票数 0
回答已采纳
1
回答
在azure上提交用python编写
的
批处理
作业
、
、
、
、
如何在azure上提交用python编写
的
批处理
作业
。我正在寻找类似于此,但不是为java,而是为python。 curl -k --user "admin:mypassword1!"
浏览 0
提问于2016-04-02
得票数 1
1
回答
hadoop
/emr如何存储键值对
、
、
、
、
我在电子病历上运行了一系列
MapReduce
作业
。但是,第三个
MapReduce
作业
需要第二个
MapReduce
作业
的
数据
输出
,并且
输出
基本上超过一百万个键值对(键和值都小于1KB)。有没有一种好方法可以将此信息存储在与EMR相同
的
计算机上
的
分布式存储
中
,以便后续
作业
可以访问这些信息?我看过,但它更多
的
是用来存储
文件
的<
浏览 3
提问于2013-05-05
得票数 1
回答已采纳
1
回答
使用Tez
的
MapReduce
、
、
我正在创建一个验证工具来检查Apache Tez是否在
Hadoop
的
hortonworks发行版
中
工作,为此,我需要检查是否在Tez上执行了一个简单
的
map reduce程序,我可以看到mapred-default.xml
中
的
一个属性必须更改。
mapreduce
.framework.name = yarn-tez (ref: http://docs.hortonworks.com/HDPDocuments/HDP2/HD
浏览 1
提问于2014-07-21
得票数 2
1
回答
按Python元组进行数值排序
的
MapReduce
、
、
、
、
我正在使用Python元组,并且有一个文本
文件
,如下所示(2,value2)...如何将
MapReduce
作业
配置为按元组
中
的
第一个键作为整数进行排序我
的
reduce
作业
需要
输出
一个有序
的
元组列表,所以我不想开始用制表符替换括号和逗号。这将是一个痛苦
的
转换回元组。我使用以下参数从bash运行我
的
hadoop</e
浏览 0
提问于2016-05-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深入理解与应用Hadoop中的MapReduce
Hadoop 介绍
MapReduce详解
使用vim在文件中插入命令执行的输出结果
MapReduce之原理、工作流程
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券