前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >0672-5.16.1-CDSW中Run Experiments异常分析

0672-5.16.1-CDSW中Run Experiments异常分析

作者头像
Fayson
发布2019-07-22 17:19:31
6800
发布2019-07-22 17:19:31
举报
文章被收录于专栏:Hadoop实操Hadoop实操

作者:唐辉

1

CDSW Experiments简介

从CDSW (Cloudera Data Science Workbench) 1.4开始,CDSW中新增了一个Experiments 功能,它允许数据科学家运行批处理实验,跟踪不同版本的代码,并进行参数输入和输出。Experiments 是批量执行的工作负载,将代码、输入参数和输出模板化。此功能还提供轻量级跟踪输出数据的功能,包括文件、指标和元数据用以进行比较。

  • 测试环境:

1.RedHat7.2

2.CDH5.16.1

2

问题描述

当我们在项目中添加一个脚本,这里使用官方示例 add.py

代码语言:javascript
复制
import sys
import cdsw

args = len(sys.argv) - 1  
sum = 0
x = 1

while (args >= x): 
    print ("Argument %i: %s" % (x, sys.argv[x]))
    sum = sum + int(sys.argv[x])
    x = x + 1

print ("Sum of the numbers is: %i." % sum)

参数如下:

run experiments ,会出现如下错误

3

解决办法

关于上面的问题主要在于run experiments 时,会run /home/cdsw/cdsw-build.sh,这个脚本中会执行pip install sklearn,当我们在离线的环境下,无法安装sklearn 包,就会出现该问题,那么解决该问题有两种办法

3.1

添加定制镜像,引入sklearn的安装包

如何定制镜像可以参考Fayson 之前的文章《如何基于CDSW基础镜像定制Docker》和《如何在CDSW中定制Docker镜像》这里不多描述,定制完成后选择新的镜像并保存

然后重新打开会话,run experiments

发现可以正常pip install sklearn,并成功执行完成

3.2

到会话中注释/home/cdsw/cdsw-build.sh 文件中的pip install sklearn

进入会话中,点击_Terminal access

注释/home/cdsw/cdsw-build.sh 文件中的pip install sklearn

然后再重新执行,也可以正常执行完成

参考文档:

代码语言:javascript
复制
https://www.cloudera.com/documentation/data-science-workbench/latest/topics/cdsw_experiments.htm

l

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器镜像服务
容器镜像服务(Tencent Container Registry,TCR)为您提供安全独享、高性能的容器镜像托管分发服务。您可同时在全球多个地域创建独享实例,以实现容器镜像的就近拉取,降低拉取时间,节约带宽成本。TCR 提供细颗粒度的权限管理及访问控制,保障您的数据安全。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档