我一直在想,是否可以将“数据准备”(.dprep)文件应用于score.py中的传入数据,类似于管道对象的应用方式。这对于模型部署非常有用。为了找出答案,我在MSDN论坛上提出了这个问题,并收到了一封response,确认这是可能的,但几乎没有解释实际如何做到这一点。得到的回应是:
在您的score.py文件中,您可以从Python SDK调用dprep包,以将相同的转换应用于传入的评分数据。确保将.dprep文件捆绑在要构建的映像中。
所以我的问题是:
- Is it: `run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)` ?
- Is there a switch to `-f` for score files?
我已经浏览了整个documentation和Workbench Repo,但似乎找不到任何示例。
如有任何建议,我们将不胜感激!
谢谢!
编辑:
场景:
pandas
我可以在'score.py‘文件中使用什么函数来应用我在工作台中创建的相同转换?
发布于 2018-06-22 19:23:43
我想我可能找到你需要的东西了。
从this documentation中,您将从azureml.dataprep
包导入。
那里没有任何示例,但在GitHub上搜索,我找到了this file,它具有以下内容来运行数据准备。
from azureml.dataprep import package
df = package.run('Data analysis.dprep', dataflow_idx=0)
希望这能有所帮助!
发布于 2018-09-03 00:37:15
在我看来,这似乎可以通过使用azureml.dataprep.package
模块中的run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)
方法来实现。
run_on_data(user_config, package_path, dataflow_idx=0, secrets=None, spark=None)
基于内存中的数据源运行指定的数据流,并将结果作为数据帧返回。user_config
参数是一个字典,它将数据源(.dsource文件)的绝对路径映射到表示为列表列表的内存中数据源。
https://stackoverflow.com/questions/50986233
复制相似问题