我用spark多个特征处理算子对原始数据进行处理,最后通过决策树训练分类,请问怎么导出最终模型?

  • 回答 (1)
  • 关注 (0)
  • 查看 (137)

环境:scala 2.11.11,spark2.4,pmml

步骤描述:最近看了智能钛的产品,想仿照写一个小的例子,然后我定义了多个object class,每个class完成一种数据处理功能,然后输出一个新的文件提供给下一个class作为输入,从而完成一连串的数据转换及特征提取工作,最后输出文件用于决策树分类训练,从而得到训练模型。

问题:请问我该如何导出最终训练完的模型?如何只在决策树class中导出pmml模型,那么此pmml模型是不是不包含前面的一串数据处理方法?如果我部署此pmml模型,那么调用的时候是不是不能直接传入源数据?

本人机器学习小白,谢谢帮助

用户6417683用户6417683提问于
腾讯智能钛AI开发者

腾讯云 · 智能钛产品团队 (已认证)

腾讯智能钛产品团队官方运营账号。分享产品最新动态,第一时间解答用户疑问。回答于
推荐

您好,如果是使用组件自己编写的代码,可以使用 spark 中的 pipeline 功能,将多个功能串成一个流水线,再把流水线导出为 pmml 模型。详见 https://github.com/jpmml/jpmml-sparkml。

可能回答问题的人

  • Superbeet

    5 粉丝0 提问0 回答
  • 腾讯云AI中心

    腾讯云 · 产品经理 (已认证)

    66 粉丝0 提问19 回答
  • 莫烦

    4 粉丝0 提问0 回答
  • 晏栋栋栋

    3 粉丝0 提问1 回答
  • 腾讯智能钛AI开发者

    腾讯云 · 智能钛产品团队 (已认证)

    32 粉丝0 提问44 回答
  • daiye

    2 粉丝0 提问0 回答

扫码关注云+社区

领取腾讯云代金券