问如何将dprep包应用于score.py Azure工作台中的传入数据
EN

Stack Overflow用户

提问于 2018-06-22 18:45:53

回答 2查看 288关注 0票数 1

我一直在想，是否可以将“数据准备”(.dprep)文件应用于score.py中的传入数据，类似于管道对象的应用方式。这对于模型部署非常有用。为了找出答案，我在MSDN论坛上提出了这个问题，并收到了一封response，确认这是可能的，但几乎没有解释实际如何做到这一点。得到的回应是：

在您的score.py文件中，您可以从Python SDK调用dprep包，以将相同的转换应用于传入的评分数据。确保将.dprep文件捆绑在要构建的映像中。

所以我的问题是：

我应该应用什么函数来调用此dprep包？

- Is it: `run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)` ?

从命令行界面创建web服务时，如何将其捆绑到映像中？

- Is there a switch to `-f` for score files?

我已经浏览了整个documentation和Workbench Repo，但似乎找不到任何示例。

如有任何建议，我们将不胜感激！

谢谢!

编辑：

场景：

pandas

我从一个实时数据库导入我的数据，假设这个数据集有10列。然后，

我使用工作台对这个(.dsource)数据集进行特征工程，生成一个可能包含13个deployment.

This数据集的.dsource文件，然后将其作为.dprep DataFrame导入，并用于训练和测试我的模型。

现在我已经准备好了一个可用于pandas的模型模型通过模型管理部署到容器服务，并将从一个实时数据库中输入数据，该数据库将再次采用原始格式(10列)。

显然，此模型已在转换后的数据(13列)上进行了训练，将无法对10列数据集进行预测。

我可以在'score.py‘文件中使用什么函数来应用我在工作台中创建的相同转换？

azure

azure-machine-learning-studio

azure-machine-learning-workbench

回答 2

Stack Overflow用户

发布于 2018-06-22 19:23:43

我想我可能找到你需要的东西了。

从this documentation中，您将从azureml.dataprep包导入。

那里没有任何示例，但在GitHub上搜索，我找到了this file，它具有以下内容来运行数据准备。

from azureml.dataprep import package

df = package.run('Data analysis.dprep', dataflow_idx=0)

希望这能有所帮助！

票数 0

Stack Overflow用户

发布于 2018-09-03 00:37:15

在我看来，这似乎可以通过使用azureml.dataprep.package模块中的run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)方法来实现。

在documentation中：

run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)基于内存中的数据源运行指定的数据流，并将结果作为数据帧返回。user_config参数是一个字典，它将数据源(.dsource文件)的绝对路径映射到表示为列表列表的内存中数据源。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50986233

复制

相似问题

问如何将dprep包应用于score.py Azure工作台中的传入数据
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将dprep包应用于score.py Azure工作台中的传入数据EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何将dprep包应用于score.py Azure工作台中的传入数据
EN