专栏首页即使数据科学家也面临人工智能的威胁

即使数据科学家也面临人工智能的威胁

自从AI(人工智能)被用于自动化处理任何事情,人们便开始感到不安。现在人工智能已经证明了它能够通过机器人等技术代替蓝领工作,通过自然语言生成取代白领工作,围绕这种技术的文化敏感度正在上升。

这也许可以解释为什么当谈到AI的影响时,我们开始看到人们对“自动化技术”使用近似同义词和准委婉语。当讨论自动化侵入到AI驱动应用程序的开发中时,一些观察者更喜欢使用诸如“操作化”,“生产化”,“扩充”和“加速”等术语。我们还看到围绕“自助服务”用来实现“可重复工作流程”等等的讨论,这听起来像是实现工作流程自动化的下一个合理步骤。

对“自动化”这个词的厌恶,可能源于这样一个事实:即使是数据科学家也开始担心它会对自己工作安全产生的潜在影响。正是考虑到这种文化时代精神,我阅读了安德鲁·布鲁斯特(AndrewBrust)最近的一篇文章,是关于Alteryx的“可操作性”机器学习模型的新工具的内容。他提供了一个非常好的论述,不仅得益于数据科学提高生产力,而且提供了来自其他供应商的不同解决方案,所有这些都不同程度地将自动化推向了数据科学开发,部署和优化工作流程的方向发展。

在我自己关于Wikibon的研究中,我看到所谓的“ 数据科学的开发者 ”数量显著的激增,我认为这是自动化的另一种委婉说法。虽然Brust说,虽然在数据科学工作流程中减少工人的前景“没有什么好处”,但是很明显有很多低层次的工作,如果没有自动化,这些工作可能被一些不熟练的数据科学家(但是已经采用的)处理,也可能再也没有人来处理。

Alteryx的工具正处于领先的数据科学工具供应商现在所提供的主流,所以他们很好地展示了自动化数据科学家所期待的方式:

  • 在推广和部署阶段,无代码的Alteryx Designer工具会自动在机器学习模型周围生成定制的 REST API和Docker镜像。
  • Alteryx新推出的Promote工具使用最近与Yhat公司合作收购的数据科学模型管理技术 ,自动在Alteryx服务器分析平台上部署这些模型。
  • Promote工具可以根据不断变化的应用程序需求自动缩放每个模型的运行时资源消耗。
  • 设计师工作流可以设置为自动重新训练机器学习模型,使用新的数据,然后接口促进自动重新部署。
  • Promote反过来可以通过跟踪当前部署哪个模型版本,并确保在生产中始终存在一个充分预测模型,自动确保模型管理。

也许我不应该夸大自动化的潜力,使数据科学家处于这个尴尬的局面上。无论怎样,数据科学自动化工具将帮助他们少花钱多办事。这些功能甚至可以减轻重复的任务,使数据科学家能够在更具创造性和挑战性的领域增长能力。自动化甚至可以让他们避免劳动力短缺的问题。正如“ 麻省理工学院技术评论最近的一篇文章所说的那样,缺乏技术人员,没有适度的发展自动化,这将粉碎AI /机器学习革命。

即使熟练的数据科学家也无法掌握工作的每一个技巧,这为自动化工具打开了大门,可以协助他们动态优化模型超参数。

自动化正在走进数据开发,部署和管理流程的每个片段。更多的数据专业人士正在采用工业级自动化功能,以加快数据采集,准备,清洗和交付等可重复过程的执行。

本文的版权归 Lethe丶L 所有,如需转载请联系作者。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 支持向量机简介

    在Statsbot团队发布关于时间序列异常检测的帖子之后,许多读者要求我们向他们介绍支持向量机的方法。现在是向您介绍SVM(支持向量机)的时候了,而不用您辛苦的...

    Lethe丶L
  • 云数据库安全,农场和餐馆:知道你的来源的重要性

    这篇内容篇幅比较长,如果不想深入探讨或时间有限,可以看总结:为了确保公司基于云的资产的安全性,首先应用经过修改的经过验证的真实数据安全实践来以解决虚拟网络环境的...

    Lethe丶L
  • 从程序员的角度看神经网络的激活功能

    这篇文章是系列文章的第二部分,讨论使用Java以简单易懂的方式编程神经网络的方法。

    Lethe丶L
  • 三层架构之我见 —— 不同于您见过的三层架构。

           我从02年开始了编程的工作,开始接触一些简单的网站,下半年写了个小的自助建站程序(asp和asp.net),比较简陋没有使用。03年开始正式做网站...

    用户1174620
  • 嘉维蓝鲸的2018,转型、蜕变、收获!嘉维蓝鲸的2019,研运一体强助力!

    这一年,蓝鲸平台从自动化运维平台,重新定义为研发运营一体化平台,实现了CI、CD、CO的IT管理全生命周期的打通。

    嘉为科技
  • 解决jupyter notebook打不开无反应 浏览器未启动的问题

    这几天要看几个ipython格式的文件,但是jupyter notebook打开之后一直卡在命令行的界面那里(如图),然后就不动了,浏览器也没有预期地自动弹出来...

    砸漏
  • 史上最详细的sqlServer手工注入详解

    MSSQL是指微软的SQL Server数据库服务器,它是一个数据库平台,提供数据库的从服务器到终端的完整的解决方案,其中数据库服务器部分,是一个数据库管理系统...

    7089bAt@PowerLi
  • 先行者~项目【更新】

    包括开发的步骤,里面的一些知识点。这样你可以在碎片时间里抽空阅读,先了解一下这个demo的大概情况,然后等有大块的时间的时候,再下载相应的源码、视频,进行深入的...

    web前端教室
  • 气象编程|值得收藏的Numpy小抄表(含主要语法、代码)

    NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型...

    气象学家
  • 简约而不简单|值得收藏的Numpy小抄表(含主要语法、代码)

    NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型...

    用户2769421

扫码关注云+社区

领取腾讯云代金券