Two Server模式就是把Azkaban和MySQL进行了分离,下面就介绍一下这种部署模式。
node1:azkaban-web、azkaban-exec
node2:MySQL
这里本人将azkaban的相关服务放置到一台服务器中,将MySQL放置到另外一台服务器中。
两台服务器,服务器系统这里选择的是CentOS7。一台称之为node1、另外一台称之为node2。
在node2上创建一个放置建表文件的目录:
mkdir –p /home/script/azkabansql
到编译的目录中,将编译好的文件远程拷贝到目标主机:
cd /opt/azkaban/azkaban/azkaban-db/build/distributions/
scp azkaban-db-3.66.0-6-ge20c886.tar.gz root@node2:/home/script/azkabansql/
到node2上解压文件
cd /home/script/azkabansql
tar -zxvf azkaban-db-3.66.0-6-ge20c886.tar.gz
以上为解压出来的文件,这里需要使用的就是红框框起来的sql文件。
在存放建表语句文件的目录下登录MySQL,如果不在此目录的话,建表文件使用非常麻烦。
mysql –u root –p
create database azkaban66;
use azkaban66
本人的数据库中已经有一个azkaban的数据库在使用了,这里本人创建了一个新的数据库,以azkaban的版本号结尾,数据库的名字可按需创建。
这一步可以省略,你可以使用原有的root账户进行数据库的操作。
create user ‘azkaban’@’%’ identified by ‘azkaban’;
前一个azkaban是用户名,后一个azkaban是密码。
4.设置权限
给用户赋予权限
grant select,insert,update,delete on azkaban66.* to ‘azkaban’@’%’ with grant option;
flush privileges ;
执行以下文件,进行建表:
source azkaban-db-3.66.0-6-ge20c886/create-all-sql-3.66.0-6-ge20c886.sql
如果不是在当前目录下进入MySQL的话,可以使用绝对路径来进行文件导入。
下图为数据库中建立的表:
如果如果想要使azkaban在创建项目的时候description支持中文输入,那么这里就需要更改一个表的一个字段的字符集即可。
需要修改的表为projects表。
使用数据库连接工具Navicat for MySQL,连接到库,右键projects表,选择设计表,出现如下图的界面:
选中字段,修改字符集为utf8,然后保存即可。
有的时候,会上传的文件过大,超过MySQL接收的默认最大值,这里可以修改一下MySQL的默认最大值。
vim /etc/my.cnf
max_allowed_packet=1024M
修改完成之后,重启数据库。
将编译好的文件拷贝到node2中规划的目录里去:
cd opt/azkaban/azkaban/azkaban-web-server/build/distributions/
cp azkaban-exec-server-3.66.0-6-ge20c886.tar.gz /opt/azkaban/
cd opt/azkaban/azkaban/azkaban-exec-server/build/distributions/
cp azkaban-web-server-3.66.0-6-ge20c886.tar.gz /opt/azkaban/
# 解压
cd /opt/azkaban/
tar -zxvf azkaban-web-server-3.66.0-6-ge20c886.tar.gz
tar -zxvf azkaban-exec-server-3.66.0-6-ge20c886.tar.gz
解压之后,web下的文件夹列表如下:
exec下的文件夹列表如下:
官方网站上提示:
所以现在只有exec目录下少了一个文件。
官方的文档顺序,是先配置的exec,这里也先从exec开始配置。
进入exec的conf目录中,可以看到有如下三个个文件:
其中global.properties是一个空的文件。
编辑此文件,命令如下:
vim azkaban.properties
文件的原始内容,如下图:
由官方文档得知,exec可以配置两大项内容:
下面开始配置,可将原来的文件中,不需要的属性注释掉,或者将原始文件改名复制一份,再进行修改。
# Azkaban Personalization Settings
# 可以将其他的属性注释掉或者删除,这里只配置时区这一项
default.timezone.id=Asia/Shanghai
# Azkaban UserManager class
# Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects
# Velocity dev mode
velocity.dev.mode=false
# Azkaban Jetty server properties.
# mail settings
lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban Executor settings
executor.maxThreads=50
executor.flow.threads=30
# 这里添加一个端口配置
executor.port=12321
azkaban.execution.dir=executions
# Azkaban plugin settings
azkaban.jobtype.plugin.dir=plugins/jobtypes
# Azkaban mysql settings by default. Users should configure their own username and password.
database.type=mysql
mysql.port=3306
mysql.host=MySQL的ip地址
mysql.database=azkaban66
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100
打开此文件,文件中已经配置好了
在exec的home目录下执行以下目录,启动exec服务:
bin/start-exec.sh
启动之后,home目录下的文件变为如下:
激活执行器有一个明显的地方可以看到,在数据库中executors表中,你可以查看当前服务器的active字段,没有激活的时候是0,激活之后是1。
如果不激活,那么在启动web的时候执行任务会报出找不到执行器的错误。
启动exec服务器之后,在exec服务器的home目录中立即执行如下命令,激活执行器:
curl -G "localhost:$(<./executor.port)/executor?action=activate" && echo
如下图:
经过后续的测试发现,每次重启exec服务器,都需要激活。
进入web的目录,执行如下命令:
keytool -keystore keystore -alias jetty -genkey -keyalg RSA
此命令是固定的,不需要更改什么。如下是执行过程:
[root@node1 azkaban-web-server-3.66.0-6-ge20c886]# keytool -keystore keystore -alias jetty -genkey -keyalg RSA
Enter keystore password: #密码
Re-enter new password: #密码
What is your first and last name?
[Unknown]:
What is the name of your organizational unit?
[Unknown]:
What is the name of your organization?
[Unknown]:
What is the name of your City or Locality?
[Unknown]:
What is the name of your State or Province?
[Unknown]:
What is the two-letter country code for this unit?
[Unknown]:
Is CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=Unknown correct?
[no]: y
Enter key password for <jetty>
(RETURN if same as keystore password): #密码
Re-enter new password: #密码
此时在看web目录之下,多了一个keystore文件。
如果是在别的目录之下进行的这个命令操作,在相应的目录下会有这个文件,只要将这个文件拷贝到web目录下即可。
此文件在conf目录下:
cd conf/
由上图可以看到,conf目录下存在四个文件。
cp azkaban.properties azkban.properties.model #复制一份,以免出错
vim azkaban.properties
如下图,为原始的azkaban.properties文件中的内容:
下面进行内容修改:
# Azkaban Personalization Settings
azkaban.name=#按规划填写
azkaban.label=#按规划填写
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
web.resource.dir=/opt/azkaban/azkaban-web-server-3.66.0-6-ge20c886/web/
default.timezone.id=Asia/Shanghai
# Azkaban UserManager class
user.manager.class=azkaban.user.XmlUserManager
user.manager.xml.file=/opt/azkaban/azkaban-web-server-3.66.0-6-ge20c886/conf/azkaban-users.xml
# Loader for projects
executor.global.properties=conf/global.properties
azkaban.project.dir=projects
# Velocity dev mode
velocity.dev.mode=false
# Azkaban Jetty server properties.
jetty.maxThreads=25
jetty.port=8081
jetty.ssl.port=8443
jetty.keystore=keystore
jetty.password=azkaban
jetty.keypassword=azkaban
jetty.truststore=keystore
jetty.trustpassword=azkaban
# Project Manager settings
project.temp.dir=/temp
project.version.retention=3
# Azkaban Executor settings
executor.port=12321
# mail settings
mail.sender=xxxxx@xxx.xx
mail.host=smtp.263.net
mail.user=xxxx@xxx.xx
mail.password=*********
# 以下两项可以不填
job.failure.email=
job.success.email=
lockdown.create.projects=false
cache.directory=cache
# JMX stats
jetty.connector.stats=true
executor.connector.stats=true
# Azkaban plugin settings
azkaban.jobtype.plugin.dir=plugins/jobtypes
# Azkaban mysql settings by default. Users should configure their own username and password.
database.type=mysql
mysql.port=3306
mysql.host=ip地址
mysql.database=azkaban66
mysql.user=azkaban
mysql.password=azkaban
mysql.numconnections=100
#Multiple Executor
azkaban.use.multiple.executors=true
azkaban.executorselector.filters=StaticRemainingFlowSize,MinimumFreeMemory,CpuStatus
azkaban.executorselector.comparator.NumberOfAssignedFlowComparator=1
azkaban.executorselector.comparator.Memory=1
在web的home目录下创建文件plugins/jobtypes,命令如下:
midir –p plugins/jobtypes
添加azkaban的用户,在此文件中操作,文件原始内容如下图:
如果要添加用户,就按照<user/>的格式添加即可。
此文件和exec中的内容是一样的。
mail.sender、mail.host、mail.user、mail.password这四项每一项配置都不能少,端口可以不配置,而且mail.sender和mail.user的值是一样的,少一项或者配错一项都会报出错误,错误信息如下:
2018/12/28 15:56:01.187 +0800 ERROR [EmailMessage] [Azkaban] Connecting to SMTP server failed, attempt: 0
javax.mail.AuthenticationFailedException: 500 Error: bad syntax
at com.sun.mail.smtp.SMTPTransport$Authenticator.authenticate(SMTPTransport.java:823)
at com.sun.mail.smtp.SMTPTransport.authenticate(SMTPTransport.java:756)
at com.sun.mail.smtp.SMTPTransport.protocolConnect(SMTPTransport.java:673)
at javax.mail.Service.connect(Service.java:295)
at azkaban.utils.JavaxMailSender.connect(JavaxMailSender.java:34)
at azkaban.utils.EmailMessage.connectToSMTPServer(EmailMessage.java:220)
at azkaban.utils.EmailMessage.retryConnectToSMTPServer(EmailMessage.java:230)
at azkaban.utils.EmailMessage.sendEmail(EmailMessage.java:213)
at azkaban.utils.Emailer.sendEmail(Emailer.java:220)
at azkaban.utils.Emailer.alertOnSuccess(Emailer.java:153)
at azkaban.executor.selector.ExecutionControllerUtils.alertUser(ExecutionControllerUtils.java:123)
at azkaban.executor.ExecutionFinalizer.finalizeFlow(ExecutionFinalizer.java:98)
at azkaban.executor.RunningExecutionsUpdater.updateExecutions(RunningExecutionsUpdater.java:131)
at azkaban.executor.RunningExecutionsUpdaterThread.run(RunningExecutionsUpdaterThread.java:54)
在网上看到一个说这个错误信息解决方法的,要改源码,其实是配置信息写错了。
azkaban.jobtype.plugin.dir=plugins/jobtypes这一项一定要配置,并且创建文件夹,不然会报错,错误信息如下:
2018/12/28 15:50:30.898 +0800 ERROR [FlowTriggerScheduler] [Azkaban] unable to get scheduled flow triggers
java.lang.NullPointerException
at azkaban.flowtrigger.quartz.FlowTriggerScheduler.getScheduledFlowTriggerJobs(FlowTriggerScheduler.java:132)
at azkaban.webapp.servlet.FlowTriggerServlet.handlePage(FlowTriggerServlet.java:140)
at azkaban.webapp.servlet.FlowTriggerServlet.handleGet(FlowTriggerServlet.java:55)
at azkaban.webapp.servlet.LoginAbstractAzkabanServlet.doGet(LoginAbstractAzkabanServlet.java:123)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:668)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:770)
at org.mortbay.jetty.servlet.ServletHolder.handle(ServletHolder.java:511)
at org.mortbay.jetty.servlet.ServletHandler.handle(ServletHandler.java:401)
at org.mortbay.jetty.servlet.SessionHandler.handle(SessionHandler.java:182)
at org.mortbay.jetty.handler.ContextHandler.handle(ContextHandler.java:766)
at org.mortbay.jetty.handler.HandlerWrapper.handle(HandlerWrapper.java:152)
at org.mortbay.jetty.Server.handle(Server.java:326)
at org.mortbay.jetty.HttpConnection.handleRequest(HttpConnection.java:542)
at org.mortbay.jetty.HttpConnection$RequestHandler.headerComplete(HttpConnection.java:928)
at org.mortbay.jetty.HttpParser.parseNext(HttpParser.java:549)
at org.mortbay.jetty.HttpParser.parseAvailable(HttpParser.java:212)
at org.mortbay.jetty.HttpConnection.handle(HttpConnection.java:404)
at org.mortbay.jetty.bio.SocketConnector$Connection.run(SocketConnector.java:228)
at org.mortbay.jetty.security.SslSocketConnector$SslConnection.run(SslSocketConnector.java:713)
at org.mortbay.thread.QueuedThreadPool$PoolThread.run(QueuedThreadPool.java:582)
Multiple Executor的几项必须配置,不然的话会报出以下错误:
2018/12/28 15:43:28.406 +0800 ERROR [StdOutErrRedirect] [Azkaban] Exception in thread "main"
2018/12/28 15:43:28.406 +0800 ERROR [StdOutErrRedirect] [Azkaban] java.lang.IllegalArgumentException: azkaban.use.multiple.executors must be true. Single executor mode is not supported any more.
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.checkMultiExecutorMode(ExecutorManager.java:240)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.setupExecutors(ExecutorManager.java:229)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.initialize(ExecutorManager.java:155)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.executor.ExecutorManager.start(ExecutorManager.java:168)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.launch(AzkabanWebServer.java:235)
2018/12/28 15:43:28.407 +0800 ERROR [StdOutErrRedirect] [Azkaban] at azkaban.webapp.AzkabanWebServer.main(AzkabanWebServer.java:226)
如果使用的是CDH平台安装的hadoop相关的软件,那么在启动Azkaban的时候日志第一行会出现如下的错误信息:
Error: HADOOP_HOME is not set. Hadoop job types will not run properly.
这个错误不影响Azkaban正常的执行hadoop相关的脚本。
这是因为CDH平台集成的Hadoop没有在profile中添加环境变量,这里需要在profile文件中添加两个环境变量。操作如下:
vim /etc/profile
要添加的内容如下:
export HADOOP_HOME=/opt/cloudera/parcels/CDH
export HADOOP_CONF_DIR=/etc/hadoop/conf.cloudera.yarn
添加完成source,让文件生效。
source /etc/profile
以上两条变量的值是CDH的目录,填写的时候,查看一下,自己的CDH安装是否是这两个目录,如果不是,值要根据自己的目录进行修改。
然后重启Azkaban web,日志中的错误消失,取代是如下内容:
Using Hadoop from /opt/cloudera/parcels/CDH
启动命令如下:
bin/start-web.sh
在浏览器中输入:ip:8443,会出现如下图的登录界面:
由上图可以看出,红块的地方是填写的azkaban.name和azkaban.labe两项的值,这里本人打了码,配置完成你们即可看到自己的成果。
以下是本人准备的一个简答的脚本的job文件,weather.job:
type=command
command=/usr/java/default/jdk/bin/java -jar /home/script/Weather.jar
failure.emails=xxx@xxx.xx
success.emails=xxx@xxx.xx
上面两项邮箱相关的,一项是执行成功发送邮件,一项是执行失败发送邮件。邮箱自行填写。如果这里不填写邮箱,那么就不会给你发送执行结果。
将文件打成zip的压缩包上传到测试项目中,选择执行。
执行成功,也有邮件发送。
以上为整个Two Server模式配置的整个过程和踩过的坑。