专栏首页决策智能与机器学习2019年数据科学的热门趋势

2019年数据科学的热门趋势

翻译 | Ethon

今年有望成为人工智能技术爆发的一年。不信的话,可以看看有多少以AI为名义的创业公司;再看AI引起了多少科技巨头的关注或者那些顶级会议的核心议题。

AI现在无处不在—甚至现在AI本身都已经是个流行词了。但AI究竟该如何定义呢?现在还是个非常困难且有争议的话题。

最近几年的流行词

但显而易见的是,数据科学正在解决着实际问题。现在数据无处不在,处理及应用数据的方法也越来越多,并对社会产生着愈加深刻的影响。那么相对于其他“流行词”,数据科学又有着怎样的趋势?

显然数据科学,也持续受到人们的关注!

2018年数据科学在自主化、可解释性和商业化方面得到了长足发展,那么2019年的主要技术趋势会是那些呢?

在作者看来,数据科学的核心必然围绕以下问题,并不断促使技术成熟化:

  • 如何缩短数据清洗和特征工程所耗费的时间?
  • 在机器学习环境下,如何定义“信任”?
  • 如何说一个机器模型是“公正的(fair)”,那么该如何定义其特征?

根据什么准则,我们就可以说能够信任机器人了?

除了以上的那么基本问题,更难回答的是,那些是有前景的方向和技术?

强化学习自从出现以来经历了许多次起起落落,现在看来,它又将迎来一个“春天”了。一个重要标志是其在Dota2中的表现。尽管强化学习还有很多问题要解决,但该它是现有技术中最接近人类学习行为的,我们很期待看待它在社会中的应用。

我们或许能够见证强化学习从概念成为实际的应用产品。如果你有兴趣的化,可以关注下它并尝试应用OpenAI gym来进行开发。

通用数据保护条例(General Data Protection Regulation,GDPR)从2018年5月28日起在欧盟生效,并直接影响了数据科学。但问题是:企业还在学习和理解这个新条例的规定。最主要的两个关注点是:

数据隐私:那些对个人数据进行非法处理的公司,将面临巨额罚款。这是否意味着研究人员接触数据将变得越来越困难?这是否会带来数据合成技术的兴起?最后,我们能实现真正的“数据隐身”吗?

可解释性:完全的自主决策必须是可解释的。但是“可解释”该如何定义呢?对于机器学习算法的解释,将采用什么统一的标准呢?这些欧盟的条例中并没有给出合理的答案。

GDPR’s Recital 71: The data subject should have “the right… to obtain an explanation of the decision reached… and to challenge the decision.”

Trustworthy AI has two components: (1) it should respect fundamental rights, applicable regulation and core principles and values, ensuring an “ethical purpose” and (2) it should be technically robust and reliable since, even with good intentions, a lack of technological mastery can cause unintentional harm [EU AI Ethics]

当AI技术对社会产生更深刻的影响是,我们必须努力消除不公平性,确保AI技术是对大众有利的,而不仅仅是某些人牟利的工具。幸运的是,广大企业和机构正在为此努力着。欧盟AI道德规范(EU AI Ethices draft)和Google的AI准则就是很好的例子。

随着算法的日益复杂和数据量的不断增大,使用个人电脑开展数据科学的人越来越少,都转而使用基于云的计算平台(如 Google Colab)。时间是有限的,但GPU可以是无限的...,个人电脑已经跟不上计算能力的需求。

现在出现了许多以往不存在的专业领域,并日益成为数据科学家的必备技能。在我看来,数据工程(Data Engineering)技术将成为2019年的最主要的方向,并在AI公司的构成中占据重要的地位。

最后,请记住时间是我们最宝贵的资产,从现在开始选定你的方向,将每一秒都用在有意义和不同寻常的工作上。

本文分享自微信公众号 - 决策智能与机器学习(AIfreak),作者:Hugo Lopes

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何测试AI系统?

    曾经从事过应用程序开发项目的人都知道,不仅是要将代码和内容在生产中,向客户,员工或利益相关者展示出来,而且需要先对其进行测试以确保其不会损坏或交付失败。质量保证...

    用户7623498
  • 强化学习(1) | 夺旗行动:复杂合作角色的出现

    掌握多人电子游戏中的策略、战术理解和团队合作是人工智能研究的一个关键挑战。在我们最新的文章中,我们发表了强化学习的新进展,我们发明的方法在Quake III 竞...

    用户7623498
  • 机器学习与人工智能在金融行业的应用

    近年来,金融服务业越来越多地使用人工智能(AI)和机器学习(ML)。大多数专家认为,AI和ML对于金融机构来说有很大的潜在好处,包括节约成本,提高效率,提高服务...

    用户7623498
  • 创新工场“AI蒙汗药”入选NeurIPS 2019,3年VC+AI布局进入科研收获季

    名为“Learning to Confuse: Generating Training Time Adversarial Data with Auto-Enco...

    量子位
  • 在人工智能的世界里,测试将是一场噩梦,衡量标准将是关键

    人工智能进入企业是由更多的数据的可用性推动。更多有趣的数据可用于更高的数据量,因为已经被测试的系统,应用程序,进程和接口的数量正在增加。数据的可用性使龙头企业进...

    企鹅号小编
  • 找对象的区块链都有了,程序员你为什么还单身?

    镇定,不要怕,我们已经找到了很多方法,解决单身和撩妹撩汉这些问题了。从训练沟通、到相识相知、再到约会恋爱、结婚再婚的一条龙服务,都有合适的程序和算法来为你解决。

    HyperAI超神经
  • 《2018中国AI计算力发展报告》发布!北京算力仅排第二

    这份由浪潮联合IDC研究发布的《2018中国AI计算力发展报告》,可以给你一个第三方维度的参考。

    量子位
  • 斯坦福发布2019全球AI报告:中国论文数量超美国,自动驾驶汽车领域获投资最多

    近日,斯坦福联合MIT、哈佛、OpenAI等院校和机构发布了一份291页的《2019年度AI指数报告》。这份长达291页的报告从AI的研究&发展、会议、技术性能...

    曼孚科技
  • 2020年全球医疗市场 AI 地图:落地、技术、应用、终端用户产业及地理分布

    【新智元导读】由 MarketandMarkets™ 发布的市场研究报告《全球预测 2020:医疗市场 AI 的落地(硬件、软件和服务)、技术(DL、量化方法、...

    新智元
  • 剑桥AI报告出炉:谷歌成为全美最大AI雇主,中美贸易战将争抢半导体公司

    我们都知道,美国是全球人工智能人才的温床,是人才交流最集中的地方。而在众多美国科技公司里,谷歌成为当前最大的 AI 人才雇主。仅次于谷歌的还有微软、IBM、Fa...

    IT派

扫码关注云+社区

领取腾讯云代金券