首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用 Livy Rest API 提交 spark 批量任务 (jar,Python, streaming)

Livy是一个开源的REST 接口,用于与Spark进行交互,它同时支持提交执行代码段和完整的程序。 ? image.png Livy封装了spark-submit并支持远端执行。...启动服务器 执行以下命令,启动livy服务器。 ./bin/livy-server 这里假设spark使用yarn模式,所以所有文件路径都默认位于HDFS中。...如果是本地开发模式的话,直接使用本地文件即可(注意必须配置livy.conf文件,设置livy.file.local-dir-whitelist = directory,以允许文件添加到session)...directory /tmp/spark-6e362908-465a-4c67-baa1-3dcf2d91449c" ], "state": "success" } 此外,还可以通过下面的api...APIcurl -X DELETE localhost:8998/batches/1 {"msg":"deleted"} 当重复调用上述接口时,什么也不会做,因为任务已经删除了: curl -X DELETE

2.9K30

Apache Livy 实现思路及模块概述

本文基于 incubator-livy 0.4.0-incubating 关于Apache Livy(下文简称 livy)是什么以及有什么用,请移步:Livy:基于Apache Spark的REST...的,还是对 batch 或 job 的一个什么样的请求(创建、查状态、拿结果还是停止)进行相应的路由,去调用某个类的某个方法 第三步:livy 是一个有权限控制的系统(当然可以不开启),每个用户的每个请求是否有权限执行...,都需要进行鉴权 第四步:对于用户发送的任务请求,livy 要有能力将其转换为一个 Spark App 并启动起来 第五步:除了要能执行用户指定的任务,运行中的 Spark App 还要提供获取运行状态...livy 模块概述.png 2.1、Client Client 并不算 livy 的模块,也很简单,在此略过 2.2、router 我们知道,livy server 提供的 apirest api...另外,SessionStore 继承了该类提供高阶 Api 来进行 sessions 的存储和恢复 总结 上述的整体思路和模块概述让我们大致了解了 livy 是怎么玩的,接下来会针对各个模块进行更深入的展开

1.7K50
您找到你想要的搜索结果了吗?
是的
没有找到

Livy Session 详解(上)

本文基于 incubator-livy 0.4.0-incubating 从Livy Rest Api的介绍中我们可以知道,livy 共有两种 job,分别是 session 和 batch。...然而,在源码实现中,session 和 batch 都是 Session 的子类,rest api 中的 session 对应源码中的 InteractivateSession;rest api 中的...在之后关于 livy 的所有文章中,session 或 batch 对应 rest api 中的含义,InteractivateSession 和 BatchSession 及 Session 都对应代码中的含义...startDriver.png 如上图,startDriver 无非就是 new 了一个 SparkLauncher 对象,进行了配置、资源、mainClass 等设置,然后调用 launch() 方法拿到了...RSCClient 对象时会在 promise 上 add 相应的 listener,promise.trySuccess(info) 会触发 onSuccess(ContextInfo info) 进而调用

2.4K40

如何通过Livy的RESTful API接口向非Kerberos环境的CDH集群提交作业

,基于Apache Spark的开源REST服务,加入Cloudera Labs》和《如何编译Livy并在非Kerberos环境的CDH集群中安装》,Livy提供了两种类型的API(编程API和RESTful...API接口),本篇文章主要介绍如何使用java代码调用Livy提供的RESTful API接口向非Kerberos环境的CDH集群提交Spark作业操作。...内容概述 1.开发环境准备 2.Livy调用示例代码 3.示例代码运行及验证 测试环境 1.CM和CDH版本为5.13.1 2.Livy版本为0.4 前置条件 1.集群未启用Kerberos 2.环境准备及描述...RESTful API调用示例代码 package com.cloudera.nokerberos; import com.cloudera.utils.HttpUtils; import java.util.HashMap...; /** * package: com.cloudera * describe: 通过Java代码调用Livy的RESTful API实现向非Kerberos的CDH集群作业提交 * creat_user

2.4K70

如何通过Livy的RESTful API接口向Kerberos环境的CDH集群提交作业

,基于Apache Spark的开源REST服务,加入Cloudera Labs》、《如何编译Livy并在非Kerberos环境的CDH集群中安装》、《如何通过Livy的RESTful API接口向非Kerberos...本篇文章主要介绍如何使用java代码调用Livy提供的RESTful API接口向Kerberos环境的CDH集群提交Spark作业操作。...内容概述 1.开发环境准备 2.Livy调用示例代码 3.示例代码运行及验证 测试环境 1.CM和CDH版本为5.13.1 2.Livy版本为0.4 前置条件 1.集群未启用Kerberos 2.环境准备及描述...RESTful API调用示例代码 package com.cloudera.kerberos; import com.cloudera.utils.KBHttpUtils; import java.util.HashMap...; /** * package: com.cloudera * describe: Kerberos环境下Livy RESTful API接口调用 * creat_user: Fayson *

3.9K120

Livy Session 详解(中)

本文基于 incubator-livy 0.4.0-incubating Livy Session 详解(上) - 简书 一文主要介绍了 session 整体的启动流程并详细分析了 client...注:如果对 livy 的整体架构以及 session client 端不了解,请先阅读以下两篇相关文章: Apache Livy 实现思路及模块概述 - 简书 Livy Session 详解(上) -...: Livy is an open source REST interface for interacting with Apache Spark from anywhere)相关的请求。...1.2、初始化 server 这一步在 RSCDriver#initializeServer() 中调用,用于连接 client 并告知 server 端 rpc 地址,client 获知 server...1.3.3、启动 Session 主要是调用 interpreter#start,该启动也是提交到 interpreterExecutor 中执行的,在启动后就会将 Session 的 state 修改为

1.5K40

如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业

github.com/fayson/cdhproject 提示:代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在CDH集群外的节点向集群提交Spark作业的方式有多种,前面Fayson介绍了Livy...相关的文章主要描述如何在集群外节点通过RESTful API接口向CDH集群提交Spark作业,本篇文章我们借助于oozie-client的API接口向非Kerberos集群提交Spark作业。...Livy相关文章: 《Livy,基于Apache Spark的开源REST服务,加入Cloudera Labs》 《如何编译Livy并在非Kerberos环境的CDH集群中安装》 《如何通过Livy的RESTful...API接口向非Kerberos环境的CDH集群提交作业》 《如何在Kerberos环境的CDH集群部署Livy》 《如何通过Livy的RESTful API接口向Kerberos环境的CDH集群提交作业...6.总结 ---- 通过Oozie API提交作业,需要先定义好workflow.xml文件 参数传递通过在代码里面调用oozieClient.createConfiguration()创建一个Properties

1.4K70

如何使用Oozie API接口向Kerberos环境的CDH集群提交Spark作业

相关的文章主要描述如何在集群外节点通过RESTful API接口向CDH集群提交Spark作业以及《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业》,本篇文章主要介绍使用...Oozie的API接口向Kerberos集群提交Spark作业。...Livy相关文章: 《Livy,基于Apache Spark的开源REST服务,加入Cloudera Labs》 《如何编译Livy并在非Kerberos环境的CDH集群中安装》 《如何通过Livy的RESTful...API接口向非Kerberos环境的CDH集群提交作业》 《如何在Kerberos环境的CDH集群部署Livy》 《如何通过Livy的RESTful API接口向Kerberos环境的CDH集群提交作业...6.总结 ---- 通过Oozie API提交作业,需要先定义好workflow.xml文件 参数传递通过在代码里面调用oozieClient.createConfiguration()创建一个Properties

1.9K70

如何使用Oozie API接口向Kerberos环境的CDH集群提交Spark2作业

6.总结 ---- 通过Oozie API提交作业,需要先定义好workflow.xml文件 参数传递通过在代码里面调用oozieClient.createConfiguration()创建一个Properties...向集群提交作业相关文章: 《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业》 《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Java作业》...《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业》 《如何使用Oozie API接口向Kerberos集群提交Java程序》 Livy相关文章: 《如何编译Livy...并在非Kerberos环境的CDH集群中安装》 《如何通过Livy的RESTful API接口向非Kerberos环境的CDH集群提交作业》 《如何在Kerberos环境的CDH集群部署Livy》 《如何通过...Livy的RESTful API接口向Kerberos环境的CDH集群提交作业》 提示:代码块部分可以左右滑动查看噢 为天地立心,为生民立命,为往圣继绝学,为万世开太平。

3.3K40

干货 | 携程机票大数据架构最佳实践

WebUI是人机交互的部分,我们会进行Ad-hoc查询,但在整个部门当中有不少程序希望调用查询,也就是应用的接口,采用SOA的架构,我们自己开发实现了 BigQuery API,可以通过这种调Restful...我们的话就是自力更生,因为你所有的内容都是可以通过Rest API读取到,只不过是需要在前端可视化一下。...目前有两个这一方面的竞品,一个Livy,另外一个就是Oyala它提供的SparkJob ServerS,干的活其实都是一样。Zeppelin是对Livy Server做了整合。...6、数据微服务 –Rest查询接口 ? 微服务这一块,我们提供了一个BigQuery API,这样的好处是有一个统一的查询入口,有统一的权限管理。...无论是从后台服务开发转到运维还是从运维后台服务器开发,两者都需要去交叉学习。

1.3K80

CDP-DC中部署Knox

使用Knox,企业可以放心地将Hadoop REST API扩展到没有Kerberos复杂性的新用户,同时还可以保持对企业安全策略的遵从性。...Knox为Hadoop REST API提供了一个中央网关,这些API具有不同程度的授权,身份验证,SSL和SSO功能,以为Hadoop提供单个访问点。...• 增强安全性:在不公开网络细节的情况下公开Hadoop的REST / HTTP服务,提供现成的SSL。 • 集中控制:集中实施REST API安全,将请求路由到多个Hadoop集群。...Apache Knox是用于与REST API和UI进行交互的应用程序网关。Knox网关为Cloudera Data Platform集群中的所有REST和HTTP交互提供了单个访问点。...顾名思义,该角色将使您能够利用Knox的Identity Broker功能,这是一种身份联合解决方案,可以将群集身份验证交换为临时云凭据。* 可选的* 网关 此角色随CSD框架一起提供。

3.1K30

028.核心组件-API Server

也可通过curl直接测试和验证Kubernetes API Server所提供的接口。...curl localhost:8080/api/v1/pods 4 [root@k8smaster01 study]# curl localhost:8080/api/v1/services #分别查看集群对应资源列表...注册表层:Kubernetes把所有资源对象都保存在注册表(Registry)中,针对注册表中的各种资源对象都定义了:资源对象的类型、如何创建资源对象、如何转换资源的不同版本,以及如何将资源编码和解码为...客户端首先调用API Server的List接口获取相关资源对象的全量数据并将其缓存到内存中,然后启动对应资源对象的Watch协程,在接收到Watch事件后,再根据事件的类型(比如新增、修改或删除)对内存中的全量资源对象列表做出相应的同步修改...每个Node上的kubelet每隔一个时间周期,就会调用一次API Server的REST接口报告自身状态,API Server在接收到这些信息后,会将节点状态信息更新到etcd中。

91730

天穹SuperSQL:腾讯下一代大数据自适应计算引擎

02 语法自适应: 解耦大数据语法和业务逻辑 SuperSQL支持对接不同类型的外部计算(执行)引擎,包括Presto、Livy、Hive、Flink,以及丰富多样的数据源,如MySQL、PostgreSQL.../TBase、Hive、TDW Hive (tHive)、SparkSQL/Livy、Oracle、Phoenix (HBase)、ElasticSearch、Kylin、ClickHouse、Hermes...,能够将SuperSQL逻辑计划转换为不同的引擎或数据源语法,做到执行引擎的无感切换,也为下文的智能引擎选择功能奠定基石。...历史检索:基于查询签名的完全匹配(exact match),调用统一元数据服务的REST API,返回最近历史区间(如一周)内的索引宽表记录集。...SuperSQL通过不同的API入参,指定返回记录集的最大行数、起止日期、超时时间等属性,确保检索的实时性能(平均 < 100ms)。

4.3K20

使用PHP对接国外的PAYPAL支付最新REST API接口。

通过这个邮件我们可以确认 REST API 是目前来说他们用的最新的接口,这个接口的流程就是 1.首先要获取TOKEN 2.然后根据TOKEN创建订单,response中会返回approve_link...URL参数跳转回您自己的页面进行后续流程) 4.在确认买家approve后,调用capture接口执行扣款(需要使用post方法调用),成功的话就表示交易完成并且资金已转入您的账户。...把ID 和 SECRET 这两个参数保存起来,在调用接口中的时候会用到。。 从文档中我们可以看到,要调用REST API接口首先要获取TOKEN。 ?..."nonce":"2020-08-12T05:39:26ZAwiJIywrfnIvhNxCYJDjNwufSAj47doGRsin47VPGFo"} 这是一个JSON字符串,里面包含了TOKEN,通过JSON...以上就是接入PAYPAL REST API 的最终成功方法。。 挺早之前我就走过一次它的流程,因为当时用的是沙箱环境,速度慢的要死,一次都没成功过,后来就放弃了。。现在有需求没办法,必须走通。

6.4K30
领券