如何在CDSW上创建Git工程

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 Fayson的github:https://github.com/fayson/cdhproject 提示:代码块部分可以左右滑动查看噢

1.文档编写目的


在CDSW上有多中创建工程的方式(创建一个空的工程、模板工程、本地上传工程或者是创建git工程),前面的都比较好理解,那如何在CDSW上创建Git工程呢?本篇文章主要介绍如何配置及创建Git工程。

  • 内容概述

1.CDSW的SSH Keys说明及查找

2.Git配置SSH Keys

3.测试

  • 测试环境

1.CM和CDH版本为5.13.1

2.CDSW版本为1.2

2.CDSW的SSH keys


在Cloudera Data Science Workbench中有两种SSH秘钥对,一种是个人用户的SSH秘钥对,一种是Workbench Team的SSH秘钥对。个人用户的秘钥任何人都不能查看,在你运行的每个控制台都会将个人用户的私钥加载到其SSH代理中,控制台可以使用私钥对外部服务(如GitHub、或者私有的Git)进行身份验证。团队的SSH秘钥对,可以让整个团队可以访问外部资源(如数据库或者Git存储库),在团队拥有的项目中启动控制台时,可以在控制台内使用该团队的SSH秘钥。那么CDSW提供的秘钥在哪里可以找到呢?

1.登录CDSW平台,查看用户的SSH keys

点击“SSH Keys”菜单

如上截图就找到了个人用户的SSHKey

2.查找Teams的SSH Keys

选择一个team,如“testteam”

点击编辑按钮

如上步骤我们已经找到了SSH Keys秘钥了,然后需要在Git上进行配置。

3.Git上配置SSH Keys


这里我们以企业搭建的私有Git仓库为例,在GitHub也是一样的方式进行配置。

1.登录Git,进入个人中心设置

点击SSH公钥管理

2.点击“添加秘钥”,添加个人账户秘钥

点击“保存”

3.点击“添加秘钥”,添加团队SSH Key

到此Git上配置就完成了,接下来我们在CDSW上测试创建Git工程。

4.创建Git工程


1.使用admin用户登录CDSW

2.点击“New Project”创建工程,选择使用Git方式创建

选择创建工程的用户为admin,输入工程名称及Git地址。这里因为没有配置hosts所以将git地址修改为ip地址。

3.点击“Create Project”

可以看到admin用户能够成功的从Git上将工程Clone到CDSW中。

4.在testteam下测试创建Git工程

5.点击“Create Project”,工程创建成功

目前该testteam中只用admin用户

至此关于CDSW创建Git功能的介绍就讲完了,更多git使用的方式大家可以跟Fayson分享。

提示:代码块部分可以左右滑动查看噢 为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

原文发布于微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文发表时间:2018-02-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏刘远的专栏

airflow—服务失效监控(5)

因为DAG文件会在调度器和worker执行时加载,如果在DAG中引用了第三方的库或进行了DB操作,则这些操作会在DAG文件加载时被频繁调用。举个例子,如果升级了...

2773
来自专栏Hadoop实操

如何使用HiBench进行基准测试

1.1K3
来自专栏搜云库

Hadoop-2.7.4 集群快速搭建

Hadoop简介 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力...

3237
来自专栏祝威廉

StreamingPro 再次支持 Structured Streaming

之前已经写过一篇文章,StreamingPro 支持Spark Structured Streaming,不过当时只是玩票性质的,因为对Spark 2.0+ 版...

1003
来自专栏我是攻城师

Spark Streaming如何使用checkpoint容错

5957
来自专栏linux驱动个人学习

DMA与cache一致性的问题

Cache和DMA本身似乎是两个毫不相关的事物。Cache被用作CPU针对内存的缓存利用程序的空间局部性和时间局部性原理,达到较高的命中率,从而避免CPU每次都...

1452
来自专栏Hadoop实操

HDFS部署最佳实践

5404
来自专栏Hadoop实操

如何在非Kerberos环境下对CDH进行扩容

Hadoop集群其中一个优点就是可伸缩性(横向扩展),通过增加计算节点使服务容量产生线性增长的能力。可伸缩的应用程序的主要特点是:只需要增加资源,而不需要对应用...

4784
来自专栏牛肉圆粉不加葱

ResourceManager剖析

972
来自专栏cloudskyme

Hadoop使用(二)

前提和设计目标 硬件错误 硬件错误是常态而不是异常。HDFS可能由成百上千的服务器所构成,每个服务器上存储着文件系统的部分数据。我们面对的现实是构成系统的组件...

37010

扫码关注云+社区

领取腾讯云代金券