腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何在
OOZIE
中
使用
正则表达式
?
shell
、
hadoop
、
oozie
、
cloudera-cdh
、
oozie-coordinator
我们可以
检查
文件是否存在于给定的HDFS位置,借助fs:exists,即path=/user/cloudera/file/input/test_<decision name="CheckFile"> <switch>但在我的示例
浏览 7
提问于2016-08-25
得票数 0
回答已采纳
2
回答
从bundle.properties设置
Oozie
包
中
的协调器名称
bundle
、
oozie
、
oozie-coordinator
我正在
使用
一个
Oozie
包来管理两个协调员(目前是这样)。它们是相同的过程,但对于两个不同的客户。我
在
启动bundle.properties时调用的bundle.xml文件
中
定义了客户端名称。我试图
使用
客户端名称来命名每个协调员,但我经常看到以下错误的变体: 错误: E0701: E0701 : XML模式错误,cvc模式-有效:值'Daily_job_#{client1}‘对于模式(a*我一直
在
尝试
使用
${}来访问变量名vs #{},基于这里的文章:,我似
浏览 0
提问于2018-02-27
得票数 0
1
回答
在
oozie
中
使用
正则表达式
检查
文件名
格式
hadoop
、
hdfs
、
oozie
我想
检查
在给定的HDFS位置
中
是否存在具有特定名称的文件。我的
文件名
类似于:TEST_20190930.csv 我
在
互联网上搜索了一下,发现fs:exists可以帮助我们
检查
这个。我想
检查
我的协调器
oozie
是否存在具有所提到的名称(Test_20190930)的文件,其中20190903是
在
HDFS上接收文件的日期。
浏览 9
提问于2019-10-01
得票数 0
2
回答
卡夫卡-> S3 ->
oozie
-> hadoop,Kafka写到一个S3位置,
oozie
每15分钟读一次这个文件夹,并将新文件推送到hadoop。
hadoop
、
amazon-s3
、
apache-kafka
、
oozie
既然
oozie
是数据的消费者,kafka是这里数据的生产者,那么我如何维护哪些文件已经被消耗,哪些文件尚未被
使用
,因为数据的生产者一直
在
写到这个位置。
浏览 5
提问于2017-11-08
得票数 0
3
回答
如何查看
Oozie
日志
hadoop
、
oozie
我的协调器失败,出现错误:当我执行hadoop fs -ls
文件名
时,E0301资源
文件名
无效,
文件名
已列出。
oozie
job -log需要jobId。
在
我的例子
中
,我没有工作id。在这种情况下,我如何查看日志。感谢你的回复。 谢谢
浏览 8
提问于2013-08-19
得票数 7
2
回答
如何在
OOZIE
的决策节点中动态获取
文件名
?
shell
、
hadoop
、
oozie
、
cloudera-cdh
、
oozie-coordinator
我想要
检查
文件是否存在,
在
HDFS位置
使用
oozie
批处理。
在
我的HDFS位置
中
,每天晚上11点,我将得到"test_08_01_2016.csv“、"test_08_02_2016.csv”这样的文件。所以我想要
检查
文件是否存在在11.15 PM之后,我可以
在
不
使用
决策节点的情况下
检查
文件的存在。通过
使用
下面的工作流。error message[${wf:errorMessag
浏览 0
提问于2016-08-22
得票数 2
回答已采纳
1
回答
具有CSV和xlsx文件
格式
的单个
正则表达式
java
、
regex
、
csv
我有一个
正则表达式
"^[\\p{Alnum}\\_]+\\.csv$",它实际
检查
文件名
模式。如果模式不匹配,比如abc.csv,那么它会抛出验证错误。因为我们还需要支持xlsx
格式
,所以
文件名
也可以是abc.xlsx。有没有办法将相同的
正则表达式
修改为csv和xlsx的文件
格式
? 谢谢!
浏览 1
提问于2015-06-26
得票数 0
2
回答
如何通过shell脚本调用
oozie
工作流,并阻塞/等待工作流完成
shell
、
blocking
、
oozie
、
error-code
、
oozie-coordinator
我已经
使用
Oozie
创建了一个工作流,它由多个操作节点组成,并且能够成功地通过协调器运行这些节点。 我想通过包装器shell脚本调用
Oozie
工作流。包装器脚本应该调用
Oozie
命令,等待
oozie
作业完成(成功或错误),并返回
Oozie
成功状态代码(0)或失败的
oozie
操作节点的错误代码(如果
oozie
工作流的任何节点失败)。从我到目前为止所看到的,我知道只要我调用
oozie
命令来运行一个工作流,该命令就会退出,并且作业id会在l
浏览 1
提问于2015-06-20
得票数 5
1
回答
文件作为命令行参数
在
Oozie
工作流
中
触发操作
oozie
、
oozie-workflow
如何将文件作为命令行参数传递给
Oozie
工作流
中
引发作业?我的spark任务是期望一个文件作为命令行参数,但是当我将该文件作为/ file /location
在
工作流
中
传递时,它并没有接收到该文件。
浏览 2
提问于2019-12-17
得票数 0
回答已采纳
1
回答
在
Oozie
中
循环
hadoop
、
oozie
我是
Oozie
的新手。有没有人能帮我解决这个问题?那么,有没有人可以帮我解决这个问题呢?
浏览 0
提问于2016-10-13
得票数 0
1
回答
未能加载db驱动程序类
oozie
失败: oracle.jdbc.OracleDriver
sqoop
、
oozie
在
使用
oozie
执行sqoop导出命令(
在
shell脚本
中
)时,我得到了以下错误。/opt/cloudera/parcels/CDH-5.7.1-1.cdh5.7.1.p0.11/lib/sqoop/lib/ /user/
oozie
/share/lib/sqoop/和/user/
oozie
/share&
浏览 5
提问于2017-10-10
得票数 2
1
回答
oozie
中
的org.apache.hadoop.mapred.lib.MultipleOutputs.addNamedOutput()
hadoop
、
mapreduce
、
hadoop2
、
mapper
、
reducers
我试图
使用
MultipleOutputs来更改减速器
中
的输出
文件名
。我
使用
oozie
工作流来运行mapreduce作业。我无法
在
oozie
工作流中找到添加以下属性的方法- MultipleOutputs.addNamedOutput(job, "text", TextOutputFormat.class, Text.class
浏览 0
提问于2018-04-16
得票数 1
1
回答
访问和操作
Oozie
中
的日期
hadoop
、
oozie
我有一个
Oozie
工作流,它需要能够
使用
不同的日期
格式
。例如,假设我
在
2015年1月16日
使用
job.properties
中
的属性job.properties运行工作流。我希望能够
在
Oozie
操作
中
自动
使用
以下路径:以及其他一些被命名为:第一个例子很简单,我只想提到我
浏览 2
提问于2015-01-16
得票数 2
回答已采纳
2
回答
Oozie
不照顾acl
hadoop
、
acl
、
kerberos
、
oozie
在
hadoop cluser上,我设计了一个具有以下属性的
oozie
工作流。但是,当我试图用与提交它的用户不同的用户杀死它时,
oozie
返回一个错误E0508。
oozie
job -
oozie
http://localhost:11000/
oozie
-kill 0000000-151020102420689-
oozie
-oozi-WError: E0508 : E0508: User [user] not authorized for W
浏览 1
提问于2015-10-20
得票数 0
回答已采纳
3
回答
Oozie
作业错误- java.io.IOException:未指定配置
hadoop
、
hdfs
、
oozie
我已经为hive脚本创建了一个
oozie
工作流,用于
在
表中加载数据。=${nameNode}/user/
oozie
/share/lib当我尝试
使用
命令"
oozie
job -
oozie
-config /user/
oo
浏览 2
提问于2015-04-25
得票数 9
1
回答
Azure
中
具有if条件活动的
正则表达式
azure
、
azure-data-factory
、
azure-data-factory-2
我想
使用
Azure Data Factory
中
的if condition活动
检查
文件名
中
是否包含日期模式(dd-mmm-yyy)。例如:我的
文件名
类似于某个字符串_23-Apr-1984.csv,其中包含日期模式。我
使用
Get Metadata活动获取
文件名
,并将其传递给if condition活动,在那里我希望
检查
文件名
中
是否包含日期模式,并根据结果执行不同的任务。我知道的唯一的方法是
使用
浏览 0
提问于2020-06-23
得票数 0
3
回答
如何
检查
文件夹
中
的所有文件是否都具有相同的
格式
linux
、
bash
、
shell
我想
检查
它们是JPEG
格式
还是JPG
格式
。.*"folder/t351folder/t353folder/t355 我尝试
使用
正则表达式
,但由于
文件名
没有扩展名,所以不起作用。谁能告诉我如何验证这些文件并
检查
它们是否具有特定的
格式
。
浏览 0
提问于2012-10-12
得票数 0
回答已采纳
0
回答
多个文件依赖项的
Oozie
协调器配置
hadoop
、
oozie
是否可以配置
Oozie
协调器,以便在以下条件下触发工作流来处理每组文件:
文件名
在
每个父/组文件夹名称中都是不同的名称。我希望
oozie
所做的(如果可能的话)是:扫描该特定父目录
中
存在的所有文件,每个
文件名
将是不同的,并且通常以这些分
浏览 3
提问于2016-07-12
得票数 0
1
回答
在
安装
oozie
时创建map-减少作业时出错
oozie
错误: IO_ERROR : java.io.IOException:连接
Oozie
服务器时出错。否重试= 4.异常=连接被拒绝
浏览 2
提问于2016-10-04
得票数 0
回答已采纳
2
回答
在
AWS EMR
中
重新启动
Oozie
hadoop
、
amazon-web-services
、
oozie
、
emr
我想更改
Oozie
电子邮件操作的发件人地址,并对
oozie
-site.xml进行了一些更改。我不确定如何应用我让made.Can启动和停止服务的更改,例如AWS EMR
中
的
Oozie
? 谢谢,Sai
浏览 3
提问于2016-03-06
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券