首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在生产中部署R模型的选项

在生产中部署R模型的选项
EN

Stack Overflow用户
提问于 2014-03-10 19:15:22
回答 6查看 29.8K关注 0票数 45

在生产中部署预测模型似乎没有太多的选择,考虑到大数据的爆炸,这是令人惊讶的。

我理解开源PMML可以作为XML规范来导出模型。然后,这可以用于数据库中的评分/预测。然而,要使这一工作顺利进行,您需要使用Zementis的PMML插件,这意味着解决方案并不是真正的开源。是否有一种更容易打开的方法将PMML映射到SQL进行评分?

另一种选择是使用JSON而不是XML来输出模型预测。但在这种情况下,R模型会在哪里呢?我假设它总是需要映射到SQL...unless,R模型可以与数据位于同一台服务器上,然后使用R脚本对传入的数据运行吗?

还有其他选择吗?

EN

回答 6

Stack Overflow用户

回答已采纳

发布于 2014-03-11 01:09:21

答案实际上取决于您的生产环境是什么。

如果您的“大数据”在Hadoop上,您可以尝试这个相对较新的开源PMML“评分引擎”( 模式 )。

否则,您别无选择(除非编写定制的特定于模型的代码),只能在服务器上运行R。您将使用save将已安装的模型保存在.RData文件中,然后使用load并在服务器上运行相应的predict。(这肯定会很慢,但您可以尝试使用更多的硬件。)

你是如何做到这一点的取决于你的平台。通常有一种方法可以添加用R编写的“定制”函数,术语是UDF (用户定义函数)。在Hadoop中,您可以将此类函数添加到Pig (例如https://github.com/cd-wood/pigaddons)中,也可以使用RHadoop编写简单的映射--减少加载模型的代码,并在R中调用predict。如果数据位于Hive中,则可以使用蜂巢变换调用外部R脚本。

还有一些特定于供应商的方法,可以将用R编写的函数添加到各种SQL数据库中。同样,在文档中查找UDF。例如,PostgreSQL有PL/R

票数 16
EN

Stack Overflow用户

发布于 2014-11-23 19:59:11

下面列出了到目前为止在生产中部署R模型的替代方案。请注意,使用这些产品的工作流程彼此之间差别很大,但它们都是为了方便将经过训练的R模型作为服务公开的过程:

票数 24
EN

Stack Overflow用户

发布于 2017-03-02 21:25:21

您可以使用水管工( RESTful )为R脚本创建https://github.com/trestletech/plumberAPI。

我以部署信用模型为例,写了一篇关于它的博客文章(http://www.knowru.com/blog/how-create-restful-api-for-machine-learning-credit-model-in-r/)。

通常,我不推荐PMML,因为您使用的包可能不支持向PMML的转换。

票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22309236

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档