首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Hue中使用Oozie创建Shell工作流在脚本中切换不同用户

》,如果不在Shell脚本中使用sudo命令该如何切换到其它呢?...本篇文章主要讲述如何Hue中使用Oozie创建Shell工作流在脚本中切换用户执行Hadoop命令。...本文脚本的主要流程如下: 内容概述 1.编写测试shell脚本 2.准备测试数据及创建工作流 3.测试工作流 测试环境 1.CM和CDH版本为5.13.1 2.采用root用户操作 前置条件 1.集群未启用...,进入运行界面 3.运行成功 6.验证运行结果 1.使用fayson用户登录Hue查询test_user表 2.Shell脚本里面的hadoop fs –ls /user/hive/warehouse...正确的将该目录下数据列出 命令行使用fayson用户是没有权限查看该目录的 由此可以说明exprot HADOOP_USER_NAME成功切换了用户为hdfs 3.Impala-shell执行 为天地立心

1.1K90
您找到你想要的搜索结果了吗?
是的
没有找到

HDFS|Shell操作命令

01 — HDFS中常用的命令 HDFS文件操作常有两种方式; 命令行方式,即Hadoop提供了一套与Linux文件命令类似的命令行工具; JavaAPI,即利用Hadoop的Java库,采用编程的方式操作...看下Linux下的shell命令工具 HDFS命令基本格式:hadoop fs -cmd cmd是具体的文件操作命令,是一组数目可变的参数。...,这意味着把本地文件放入到默认的工作目录,该命令等价于: hadoop fs -put README.txt /user/root 使用Hadoop的 ls 命令,即 hadoop fs -ls 列出...例如若本地文件没有README.txt文件(即文件不在当前的host),需要从HDFS取回,可以执行如下命令hadoop fs -get README.txt ....hadoop fs -rm README.txt 05 — 检索文件README.txt 检索文件即查阅HDFS的文件内容,可以使用hadoop的cat命令

1.4K70

0521-Hadoop命令无法访问HDFS路径诡异问题解决

Fayson脚本命令行操作该数据目录时又提示“/tmp/guiyi/123: No such file or directory”,异常如下: ?...3 问题解决 在上面我们定位到HDFS路径包含特殊字符导致命令行无法正常访问HDFS路径(这里只是hadoop命令的影响,也有可能会影响Hive无法正常的获取表的数据),那接下来可以通过如下步骤解决该问题...: 1.使用hadoop命令将/tmp/guiyi目录下的所有数据目录列出到一个shell脚本 [root@cdh05 ~]# hadoop fs -ls /tmp/guiyi > test.sh [root...2.在上一步test.sh脚本的基础较该脚本修改为如下: [root@cdh05 ~]# vim test.sh hadoop fs -mv /tmp/guiyi/123^[ /tmp/guiyi/...4 总结 1.使用脚本创建HDFS目录或文件时一定要注意特殊字符问题(特别是window编写好的脚本拷贝至Linux服务器时,需要检查文件是否包含特殊字符) 2.Linux中使用vim进入编辑状态后使用

1.5K20

Azkaban介绍

工作流调度器azkaban 概述 为什么需要工作流调度系统 ● 一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序、hive脚本等 ● 各任务单元之间存在时间先后及前后依赖关系...Hadoop先将原始数据同步到HDFS; 2、 借助MapReduce计算框架对原始数据进行转换,生成的数据以分区表的形式存储到多张Hive表; 3、 需要对Hive多个表的数据进行JOIN处理...hadoop领域,常见的工作流调度器有Oozie, Azkaban,Cascading,Hamake等 各种调度工具特性对比 下面的表格对上述四种hadoop工作流调度器的关键特性进行了比较,尽管这些工作流调度器能够解决的需求场景基本一致...总体来说,ooize相比azkaban是一个重量级的任务调度系统,功能全面,配置使用也更复杂。如果可以不在意某些功能的缺失,轻量级调度器azkaban是很不错的候选对象。...和web server可以部署不同节点) Oozie作为工作流服务器运行,支持多用户和多工作流 ◆ 工作流管理 Azkaban支持浏览器以及ajax方式操作工作流 Oozie支持命令行、HTTP

39620

0462-如何在Hue创建Shell Action工作流续

1 文档编写目的 Fayson在前面的文章《Hue中使用Oozie创建Shell工作流在脚本中切换不同用户》,里面介绍了Shell Action的创建,文中我们相应的Shell脚本是放在每个Oozie...本篇文章Fayson主要介绍Hue创建Shell Action指定工作空间外的Shell脚本。.../bin/bash cd ~ ls 2.将准备好的Shell脚本put到HDFS [root@cdh2 disk1]# hadoop fs -mkdir -p /oozie/common/shell...[root@cdh2 disk1]# hadoop fs -put test.sh /oozie/common/shell [root@cdh2 disk1]# hadoop fs -ls /oozie...3.选择test.sh脚本HDFS存储的公共路径 ? ? 到此完成了Shell Action工作流的创建,保存运行吧。 4 测试运行 1.点击右上角的运行图标 ? 2.运行结果显示如下: ?

87470

将R与Cloudera Impala集成,以实现Hadoop的实时查询

介绍 Cloudera Impala支持Hadoop数据集的低延迟交互式查询,这些数据集可以存储Hadoop分布式文件系统(HDFS)或Hadoop的分布式NoSQL数据库HBase。...该解决方案将提供在Hadoop数据集运行的快速交互式查询,然后可以R内进一步处理或使数据可视化。...impala-architecture.jpeg 一种选择是使用作为impala软件包一部分的impala-shell,并提供命令行界面。...下载表格文件后,您需要从文件删除第一行(标题),然后使用Hadoop文件系统shell(HDFS Shell)将其加载到HDFS。...Impala有类SQL的查询语言,所以您可以使用熟悉的’CREATE TABLE‘命令。外部命令标明物理数据文件不在Impala中进行管理; 即使删除表格,这些文件也会保存在HDFS目录

4.3K70

Azkaban快速入门系列(1) | Azkaban的简单介绍

为什么需要工作流调度系统 一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序、hive脚本等 各任务单元之间存在时间先后及前后依赖关系 为了很好地组织起这样的复杂执行计划...,需要一个工作流调度系统来调度执行; 例如,我们可能有这样一个需求,某个业务系统每天产生20G原始数据,我们每天都要对其进行处理,处理步骤如下所示: 通过Hadoop先将原始数据上传到HDFS(HDFS...常见工作流调度系统 市面上目前有许多工作流调度器 hadoop领域,常见的工作流调度器有Oozie, Azkaban,Cascading,Hamake等 4....总体来说,ooize相比azkaban是一个重量级的任务调度系统,功能全面,配置使用也更复杂。如果可以不在意某些功能的缺失,轻量级调度器azkaban是很不错的候选对象。...方式操作工作流 Oozie支持命令行、HTTP REST、Java API、浏览器操作工作流 二.

1K10

大数据|HDFS的shell操作及基本工作机制(四)

一、HDFS分布式文件系统的shell操作 HDFS的shell操作基本和Linux的shell命令差不多,我这边重点介绍几个常用的文件操作的命令,其它更多的操作命令很少用到,当然你也可以通过“fs -...hadoop fs -copyFromLocal logs/log.out /hadoop/ 3)–put上传文件 -put:该命令选项表示把linux的文件复制到hdfshadoop fs...hadoop fs -help ls 二、HDFS分布式文件系统的基本工作机制 1、当我们命令行输入“hadoop fs -put /jdk.tar.gz /”时,hdfs会做些什么?...2、当我们命令行输入“hadoop fs -get /jdk.tar.gz”时,hdfs会做些什么?...1)hdfs文件系统会给客户端提供一个统一的抽象目录树,Hdfs的文件都是分块(block)存储的,块的大小可以通过配置参数(dfc.blocksize)来规定,默认大小hadoop2x版本是128M

74070

HDFS入门和应用开发:实战微博HDFS案例(

(1)语法格式 Hadoop提供了文件系统的shell命令行客户端,使用方法如下: Usage: hdfs [SHELL_OPTIONS] COMMAND [GENERIC_OPTIONS] [COMMAND_OPTIONS...GENERIC_OPTIONS 多个命令支持的公共选项 COMMAND COMMAND_OPTIONS 用户命令、或者是管理命令 示例: # 查看HDFS/parent/child目录下的文件或者文件夹...hdfs dfs -ls /parent/child 所有HDFS命令都可以通过bin/hdfs脚本执行。...(2)说明 文件系统shell包括与Hadoop分布式文件系统(HDFS)以及Hadoop支持的其他文件系统(如本地FS,HFTP FS,S3 FS等)直接交互的各种类似shell命令 所有FS shell...fs.defaultFS中有配置hdfs dfs -ls /parent/child (3)shell命令选项 [root@node1 bin]# hdfs dfs -usage Usage: hdfs

30400

HDFS入门和应用开发:实战微博HDFS案例(

(1)语法格式 Hadoop提供了文件系统的shell命令行客户端,使用方法如下: Usage: hdfs [SHELL_OPTIONS] COMMAND [GENERIC_OPTIONS] [COMMAND_OPTIONS...GENERIC_OPTIONS 多个命令支持的公共选项 COMMAND COMMAND_OPTIONS 用户命令、或者是管理命令 示例: # 查看HDFS/parent/child目录下的文件或者文件夹...hdfs dfs -ls /parent/child 所有HDFS命令都可以通过bin/hdfs脚本执行。...(2)说明 文件系统shell包括与Hadoop分布式文件系统(HDFS)以及Hadoop支持的其他文件系统(如本地FS,HFTP FS,S3 FS等)直接交互的各种类似shell命令 所有FS shell...fs.defaultFS中有配置hdfs dfs -ls /parent/child (3)shell命令选项 [root@node1 bin]# hdfs dfs -usage Usage: hdfs

41520

day07.HDFS学习【大数据教程】

HDFS的shell(命令行客户端)操作 3.1 HDFS命令行客户端使用 HDFS提供shell命令行客户端,使用方法如下: ?...示例: hadoop fs -ls hdfs://hadoop-server01:9000/ 备注:这些参数,所有的hdfs路径都可以简写 -->hadoop fs -ls / 等同于一条命令的效果...案例1:开发shell采集脚本 8.1需求说明 点击流日志每天都10T,在业务应用服务器,需要准实时上传至数据仓库(Hadoop HDFS) 8.2需求分析 一般上传文件都是凌晨24点操作,由于很多种类的业务数据都要在晚上进行传输...) //批量上传工作区间的文件 hadoop fs –put xxx 脚本写完之后,配置linux定时任务,每5分钟运行一次。...的日志目录(/home/hadoop/app/hadoop-2.6.4/logs) hadoop启动不正常 用浏览器访问namenode的50070端口,不正常,需要诊断问题出在哪里: a.服务器的终端命令行使用

1.3K40

初探 Hadoop 集群安全

1、 Hadoop 攻击包存在 HadoopSnooper,该脚本允许攻击者通过Hadoop组件的 Web 界面上公开的配置文件轻松检索合适的最小客户端配置。...进入kalihadoop的配置目录: /etc/hadoop 2、手工访问8088或50070、8042、16010等端口查看 conf 配置,脚本就是爬取...3、执行hdfs命令访问hadoophdfs hdfs 为 Hadoop 分布式文件系统 (HDFS), 简单理解: 该文件系统跟本地文件系统一样均可用来存放数据、文件,不同的是它是分布式,数据存在多台机器的本地系统...这边即是图形界面访问,之前我们是通过命令行方式 ? 均可实现 download,真实内网渗透这时候你就可以扒扒看是否有你需要的数据。...2、master节点生成公钥分发到所需的节点,启动 hadoop 服务未出现要密码,实际则可利用这一点来登录到任意节点 ?

1.7K20

0614-5.16.1-同一OS用户并行Shell脚本kinit不同的Principal串掉问题分析

测试环境 1.RedHat7.3 2.CDH5.16.1 2 问题描述 Fayson通过一段简单的shell脚本示例代码说明问题,代码执行kinit命令初始化Kerberos信息,通过hadoop命令去统计各自用户目录下子目录大小...通过两个脚本输出的日志可以看到a_fayson.logkinit的是fayson用户,但在执行hadoop命令的时候显示的为cdhadmin,此时Principal账号串掉导致命令执行失败。...5 解决方法二 脚本中使用了C shell(csh)命令,C shell是一个交互式命令解释器和一种编程语言,采用的语法类型于C编程语言。...C shell我们可以指定KRB5CCNAME环境变量,具体实现方式如下: 1.OS命令行执行如下命令安装csh命令 [root@cdh4 shell-test]# yum -y install...4.本篇文章主要讲述了shell脚本的两种实现方式一种脚本中使用export的方式指定环境变量,一种使用C shell命令通过setenv方式指定。

2K30

HAWQ取代传统数仓实践(五)——自动调度工作流(Oozie、Falcon)

动作节点是实际执行操作的部分,通过它们工作流会触发执行计算或者处理任务。         所有由动作节点触发的计算和处理任务都不在Oozie运行。它们是由Hadoop的MapReduce框架执行的。...不难看出,这里的谓词,其作用和SQL语句的WHERE子句中的谓词类似,本质都是满足某些条件时触发某种事件。         有时,我们还需要连接定时运行、时间间隔不同的工作流操作。...本例我使用hdp2的MySQL数据库存储Sqoop的元数据。...配置SSH免密码登录         实际的数据装载过程是通过HAWQ的函数实现的,自然工作要执行包含psql命令行的本地shell脚本文件。...关于oozie调用本地shell脚本可以参考“OOZIE调用shell脚本做mr计算挂死问题分析和解决”。 二、用Oozie建立定期ETL工作流 1.

1.9K60

OushuDB入门(六)——任务调度篇

Oozie支持的用户作业类型有Java map-reduce、Streaming map-reduce、Pig、 Hive、Sqoop和Distcp,及其Java程序和shell脚本命令等特定的系统作业...不难看出,这里的谓词,其作用和SQL语句的WHERE子句中的谓词类似,本质都是满足某些条件时触发某种事件。 有时,我们还需要连接定时运行、时间间隔不同的工作流操作。...本例我使用hdp2的MySQL数据库存储Sqoop的元数据。...配置SSH免密码登录 实际的数据装载过程是通过OushuDB的自定义函数实现的,自然工作要执行包含psql命令行的本地shell脚本文件。...关于oozie调用本地shell脚本可以参考“OOZIE调用shell脚本做mr计算挂死问题分析和解决”。 二、用Oozie建立定期ETL工作流 1.

67010

进击大数据系列(十一)Hadoop 任务调度框架 Oozie

shell脚本。...安全性可能Oozie会比较好。 工作流定义: Oozie是通过xml定义的而Azkaban为properties来定义。 部署过程: Oozie的部署相对困难些,同时它是从Yarn拉任务日志。...出现失败的情况: Azkaban会丢失所有的工作流,但是Oozie可以继续失败的工作流运行 Oozie 的架构 Oozie Client:提供命令行、java api、rest 等方式,对 Oozie...解压好Oozie安装包之后,首先在hadoop配置文件为Oozie进程配置代理用户,core-site.xml文件配置如下: hadoop.proxyuser....oozie(注意,启动之前必须先启动hadoop): bin/oozied.sh start 启动之后,可以浏览器通过11000端口访问oozie前端控制台,如下图所示: Oozie Cli 命令

36820
领券