首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何将dprep包应用于score.py Azure工作台中的传入数据

如何将dprep包应用于score.py Azure工作台中的传入数据
EN

Stack Overflow用户
提问于 2018-06-22 18:45:53
回答 2查看 288关注 0票数 1

我一直在想,是否可以将“数据准备”(.dprep)文件应用于score.py中的传入数据,类似于管道对象的应用方式。这对于模型部署非常有用。为了找出答案,我在MSDN论坛上提出了这个问题,并收到了一封response,确认这是可能的,但几乎没有解释实际如何做到这一点。得到的回应是:

在您的score.py文件中,您可以从Python SDK调用dprep包,以将相同的转换应用于传入的评分数据。确保将.dprep文件捆绑在要构建的映像中。

所以我的问题是:

  • 我应该应用什么函数来调用此dprep包?

代码语言:javascript
复制
- Is it: `run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)` ?

  • 从命令行界面创建web服务时,如何将其捆绑到映像中?

代码语言:javascript
复制
- Is there a switch to `-f` for score files?

我已经浏览了整个documentationWorkbench Repo,但似乎找不到任何示例。

如有任何建议,我们将不胜感激!

谢谢!

编辑:

场景:

pandas

  • 我从一个实时数据库导入我的数据,假设这个数据集有10列。然后,

  • 我使用工作台对这个(.dsource)数据集进行特征工程,生成一个可能包含13个deployment.

  • This数据集的.dsource文件,然后将其作为.dprep DataFrame导入,并用于训练和测试我的模型。

  • 现在我已经准备好了一个可用于pandas的模型模型通过模型管理部署到容器服务,并将从一个实时数据库中输入数据,该数据库将再次采用原始格式(10列)。

  • 显然,此模型已在转换后的数据(13列)上进行了训练,将无法对10列数据集进行预测。

我可以在'score.py‘文件中使用什么函数来应用我在工作台中创建的相同转换?

EN

回答 2

Stack Overflow用户

发布于 2018-06-22 19:23:43

我想我可能找到你需要的东西了。

this documentation中,您将从azureml.dataprep包导入。

那里没有任何示例,但在GitHub上搜索,我找到了this file,它具有以下内容来运行数据准备。

代码语言:javascript
复制
from azureml.dataprep import package

df = package.run('Data analysis.dprep', dataflow_idx=0)

希望这能有所帮助!

票数 0
EN

Stack Overflow用户

发布于 2018-09-03 00:37:15

在我看来,这似乎可以通过使用azureml.dataprep.package模块中的run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)方法来实现。

documentation中:

run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)基于内存中的数据源运行指定的数据流,并将结果作为数据帧返回。user_config参数是一个字典,它将数据源(.dsource文件)的绝对路径映射到表示为列表列表的内存中数据源。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50986233

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档