环境:scala 2.11.11,spark2.4,pmml

步骤描述:最近看了智能钛的产品,想仿照写一个小的例子,然后我定义了多个object class,每个class完成一种数据处理功能,然后输出一个新的文件提供给下一个class作为输入,从而完成一连串的数据转换及特征提取工作,最后输出文件用于决策树分类训练,从而得到训练模型。

问题:请问我该如何导出最终训练完的模型?如何只在决策树class中导出pmml模型,那么此pmml模型是不是不包含前面的一串数据处理方法?如果我部署此pmml模型,那么调用的时候是不是不能直接传入源数据?

本人机器学习小白,谢谢帮助

用户6417683用户6417683提问于
腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。回答于
推荐

您好,如果是使用组件自己编写的代码,可以使用 spark 中的 pipeline 功能,将多个功能串成一个流水线,再把流水线导出为 pmml 模型。详见 https://github.com/jpmml/jpmml-sparkml。

回答过的其他问题

智能钛能处理大数据文件吗?我有30G的数据存储在本地电脑硬盘上?

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。
推荐

关于ti-one平台问题?

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。
推荐
您好,感谢您的提问。 TI-ONE平台里的任务是运行在Linux系统上的; 目前TI-ONE工作流任务暂不支持实时查看显存使用情况,notebook任务可在右侧资源栏查看; TI-ONE已上线计费,但目前试运营阶段限时0折。试运营阶段结束,正式开启收费前会提前通知用户定价变动,还...... 展开详请

我在图像数据切分的时候,分类或检测选择完检测之后,会自己跳回分类,是什么原因?

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。

您好,这边尝试操作了一下,并未出现您描述的这种情况哦。您可以检查下您的每一步操作是否都有保存,如果还出现这种情况,可以将您的工作流链接发我们一下,帮您具体分析下问题。

智能钛 tensorflow如何升级?

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。
推荐
可以升级的,方法示例如下: import os os.system("pip install tensorflow-gpu==1.12") import tensorflow as tf print(tf.__version__) image.png ... 展开详请

智能钛机器学习平台的模型怎么从外部调用?

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。
推荐

智能钛的notebook读取数据为什么比较慢?

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。

您好,首先建议您的COS存储所在地域选择重庆哦,这样在一定程度上可以提升速度。

其次您copy cos数据到容器本地目录,比如/tmp目录下,重新测试下速度,然后麻烦告诉我是否速度有提升。

关于作者

腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯云 智能钛产品团队

扫码关注云+社区

领取腾讯云代金券