专栏首页AI科技大本营的专栏机器学习新闻综述:2019年AI领域不得不看的6篇文章

机器学习新闻综述:2019年AI领域不得不看的6篇文章

作者 | Limarc Ambalina

翻译 | 火火酱,编辑 | Carol

出品 | AI科技大本营(ID:rgznai100)

在这篇机器学习新闻综述中,我们将回顾一些2019年以来在人工智能各个领域广泛传播或产生影响的重大新闻。此外,我们还将简要介绍一些有意思的人工智能应用程序,几款2019年发布的游戏,以及一些机器学习项目的开源数据集资源。

自动驾驶汽车

1、特斯拉最新自动驾驶致死案与之前事故相似

文章链接:

https://www.wired.com/story/teslas-latest-autopilot-death-looks-like-prior-crash/

2019年对于特斯拉来说可以算是多事之秋了,该公司在这一年里遭遇了不少不幸。最引人注目的是,2019年5月,一场涉及特斯拉Model 3的悲剧事故导致驾驶员死亡。事故发生时,汽车启动了自动驾驶功能,在没有采取任何规避措施的情况下,直接撞上了一辆停在路边的卡车。这起事故导致人们对公路上常见的自动驾驶汽车的安全性产生了怀疑。

特斯拉Model 3:致命事故中的自动驾驶系统

https://www.bbc.com/news/technology-48308852

2、Waymo:“完全无人驾驶的Waymo就要来了”

文章链接:

https://techcrunch.com/2019/10/09/·waymo-to-customers-completely-driverless-waymo-cars-are-on-the-way

Waymo是自动驾驶汽车行业中另一家大型企业,该公司在去年推出了自己的自动驾驶汽车,消息一经发布便登上了新闻头条。严格来讲,Waymo隶属于谷歌的母公司Alphabet。它给其打车软件的所有用户发送了一封电子邮件,邮件中提到:您下一次的Waymo之旅或许会是完全自主的无人驾驶之旅。

自然语言处理 (NLP)

3. Open AI发布GPT1 1.5B

文章链接:

https://openai.com/blog/gpt-2-1-5b-release/

自然语言处理(NLP)领域中最大的事件之一就是在2019年11月发布的GPT2 1.5B。GPT2是来自于Open AI的文本生成神经网络,由于其生成自然语音文本的惊人能力而成为世界各地的头条新闻。一些作者甚至能够使用GPT2创建完整的文章,该技术吸引了许多在机器学习领域有影响力的人和多位著名科学家的关注。

NLP:

https://lionbridge.ai/articles/natural-language-processing-101/

使用GPT2创建完整的文章:

https://lionbridge.ai/articles/this-entire-article-was-written-by-an-ai-open-ai-gpt2/

Open AI曾经也发布过旧版本的神经网络,但是GPT2 1.5B是迄今为止的最强迭代。

在这篇文章中,Open AI解释了其5个主要发现:

1. GPT2的输出具有说服力和可信度。

2. 可以对GPT2神经网络进行微调以防滥用。

3. 合成文本检测极具挑战性。

4. 迄今为止,还没有能够证明滥用的有力证据。

5. 仍需制定出防止偏见的标准。

合成媒体

4. 美国众议院就深度伪造(Deepfake)的风险举行听证会

文章链接:

https://lionbridge.ai/articles/deepfakes-a-threat-to-individuals-and-national-security/

深度伪造(Deepfake)是2019年最大的机器学习主题之一。Deepfake所取得的全所未有的发展导致了对该技术的广泛滥用和公众的恐惧。因此,为了解和应对该技术可能会带来的威胁,美国情报委员会于2019年6月就Deepfake和AI相关问题召开了公开听证会。

视频链接:

https://youtu.be/lArPEDS0GTA

这篇文章总结了每位演讲者提出的核心观点、Deepfake的潜在风险以及其解决方法和对策。

相关文章:

众议院情报委员会将举行有关Deepfake和AI问题的公开听证会

https://intelligence.house.gov/news/documentsingle.aspx?DocumentID=657

一起来看看2020年的Deepfake。

https://lionbridge.ai/articles/a-look-at-deepfakes-in-2020/

5. Replica Studio简介

合成声音和音频是一项新兴产业,并在去年取得了飞跃性发展。Replica Studios是一家语音合成公司,该公司在2019年引起轰动,吸引了很多数据科学家、名人和对使用他们的软件感兴趣的游戏开发工作室的注意。

这种病毒式传播源自于是一段令人印象深刻的概念验证(proof-of-concept)视频,其中展示了桑达尔·皮查伊(谷歌的CEO)、杰夫·贝佐斯(亚马逊的CEO)、阿诺德·施瓦辛格、凯文·哈特、摩根·弗里曼、大卫·艾登堡、史努比·道格、艾伦·德杰尼勒斯,甚至是《The Witcher》中里维亚的合成语音。

视频链接:https://youtu.be/f4DgHI9J3U8

令人印象深刻的是,Replica Studios仅需几分钟的语音录音就可以合成任何语音副本。在一次采访中,Replica的首席执行官什里亚斯·尼瓦斯(Shreyas Nivas)说,这项技术已经到达了“合成声音与真实声音无法区分并且可以与人类声音媲美”的水平。

什里亚斯·尼瓦斯采访链接:

https://lionbridge.ai/articles/how-synthetic-voice-actors-rival-human-actors-an-interview-with-replica-studios/

数据集

6. Google如何通过Google Dataset Search来引领数据搜索

文章链接:

https://lionbridge.ai/articles/how-google-is-leading-the-quest-for-data-with-google-dataset-search/

获取训练数据是目前阻碍人工智能进步的重要因素之一。特别是在深度学习中,许多模型需要不止数千个,而是数百万个训练数据实例。因此,许多数据科学家和学生转而使用Kaggle这样的数据集聚合器,并依赖于社区提供的开源数据。为了改善对开源数据的访问,谷歌发布了一款仅用于发布和下载数据集的搜索引擎。

虽然Google Dataset Search在2019年仍处于测试阶段,但谷歌在1月23日宣布已索引了近2500万个数据集,该搜索引擎正式退出测试阶段。

2019年发布的有意思的人工智能应用程序和资源

Talk To Transformer——开源AI的GPT2 1.5B的用户友好型实现。任何人都可以使用:只需输入一个自定义提示、一篇文章的标题或一首歌的首句歌词,就可以看看文本生成神经网络会为你带来什么结果。

Talk To Transformer:https://talktotransformer.com/

Google Dataset Search——如上面第6篇文章中提到的,这是由谷歌提供的免费数据集搜索引擎。你可以在上面搜索开源的数据集,并学习如何通过搜索引擎爬取自己的资源。

Google Dataset Search:

https://datasetsearch.research.google.com/

AI Dungeon 2——一款文字冒险游戏,玩家的每一个决定都会带来独特的故事情节。在GPT2的驱动下,这款游戏可以有无数种可能,所有的故事都是不同的。点击以下链接查看示例:

https://lionbridge.ai/articles/creative-ai-the-storytelling-of-ai-dungeon/

AI Dungeon 2:https://play.aidungeon.io/

Ultimate Dataset Aggregator——来自Lionbridge AI的数据集聚合器,包括数百个开源数据集,跨越几十个用例和主题(包括计算机视觉、并行文本、生命科学、金融等等)。页面随着新数据集的不断更新而更新。

Ultimate Dataset Aggregator:

https://lionbridge.ai/datasets/ultimate-dataset-aggregator-for-machine-learning/

人工智能是世界上发展最快的行业之一,2020年肯定会有更多关于机器学习的重大新闻。希望以上提到的人工智能文章能激发你的兴趣。

原文:

https://hackernoon.com/machine-learning-news-roundup-6-essential-ai-articles-of-2019-gbw331i

(*本文由 AI 科技大本营编译,转载请联系微信1092722531)

本文分享自微信公众号 - AI科技大本营(rgznai100),作者:Limarc Ambalina

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-02-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【2019 NLP汇总】论文、博客、教程、工程进展全梳理(长文预警)

    2019 年对自然语言处理(NLP)来说是令人印象深刻的一年。本文将着重讲述一些 2019 年我在机器学习和自然语言处理领域有所见闻的重要事件。我会把重点主要放...

    zenRRan
  • 学AI哪家强?2019全球排行清华第1,北大第2

    导读:2019年过去了,21世纪10年代也过去了。马萨诸塞大学计算机与信息科学学院教授Emery Berger发布的CSRanking项目,是全球院校计算机科学...

    华章科技
  • AAAI2019报告:华人影响力跃升,中国论文录取率垫底

    AAAI 2019的两位程序主席之一是南京大学的周志华教授(下图左),周志华教授也是AAAI自1980年创办以来,首位担任大会程序主席的非欧美学者。因此,对中国...

    新智元
  • NLP简报(Issue#1)

    欢迎来到船新栏目「NLP 简报」,本新闻简报的目的是让你不必花费太多时间就可以了解与 NLP 和 ML 有关的一些有趣和最新的故事。

    NewBeeNLP
  • 2019 新年第一场 AI 口水仗正在 Twitter 进行

    2019 新年里,人工智能领域的第一场口水战已经在 Twitter 打响,这次的主题是由媒体网站 Venturebeat 的一个失误所引发的。

    HyperAI超神经
  • 推荐系统遇上深度强化学习,会有怎样的火花?

    推荐系统是我们日常生活中使用最频繁的工具之一,以内容推荐著称的今日头条等都在广泛研究,然而推荐系统的难度却非常大,精准推荐一直是一个非常棘手的问题,目前有很多解...

    石晓文
  • 最新!清华夺CS Rankings高校AI综合排行亚军,北大单项力压CMU

    全球院校计算机科学领域实力排名开源项目CSRankings,更新了2018年的最新数据。根据该项目的最新排名:

    新智元
  • AAAI 2019评审惹争议!“好论文”遭退稿?程序主席回应

    人工智能“The”顶会之一的AAAI 2019论文录取结果昨日公布,16.2%,可以说是AAAI录取率最低的年份之一,更何况今年的投稿数量高达7745篇,比去年...

    新智元
  • 迁移学习前沿研究亟需新鲜血液,深度学习理论不能掉链子

    在本篇系统综述中,作者采用了定量方法来选出对该领域的重大进展,并使用文献计量学耦合性度量来识别出来研究的前沿。另外,本论文还进一步分析了该领域的“经典”与“前沿...

    AI科技大本营
  • AAAI 2019评审惹争议!“好论文”遭退稿?程序主席回应

    人工智能“The”顶会之一的AAAI 2019论文录取结果昨日公布,16.2%,可以说是AAAI录取率最低的年份之一,更何况今年的投稿数量高达7745篇,比去年...

    昱良
  • NLP领域,哪些综述性的文章值得推荐?

    1. 《Neural Reading Comprehension And Beyond》

    zenRRan
  • 斯坦福连续发了四年的AI报告,今年讲了什么?

    由斯坦福大学发起的人工智能指数(AI Index)是一个追踪 AI 动态和进展的非营利性项目,旨在全面研究 AI 行业状况,旨在促进基于数据的 AI 广泛交流和...

    机器之心
  • 2019 年,10篇新颖到出格的 AI 论文

    前两天「AI科技评论」总结了 2019 年十大精彩 AI 学术论文,从学术价值的角度挑选了我们认为 2019 年里值得重读、值得纪念的机器学习论文。

    Piper蛋窝
  • NLP简报(Issue#9)

    RONEC[1]是罗马尼亚语的命名实体语料库,在约5000个带注释的句子中包含超过26000个实体,属于16个不同的类。这些句子摘自无版权的报纸,内容涉及多种样...

    NewBeeNLP
  • 引用次数在15000次以上的都是什么神仙论文?

    本文结合总结梳理了知乎上“引用次数在15000次以上的都是什么论文?”这一问题的经典回答,希望能帮助到各位进一步了解领域内的相关进展。并且通过阅读这些经典论文或...

    1480
  • 2019,不可错过的NLP“高光时刻”

    谷歌AI 提出了 ALBERT 模型,这是 BERT 模型的简化版本,用于语境化语言表示的自监督学习。相较于 BERT,其在模型更加精练的同时更有效地分配了模型...

    AI科技大本营
  • 每天2亿美元投入AI领域,1/10砸向自动驾驶,中国AI论文首超全欧洲 | 斯坦福全球AI年度报告

    而且纵横全球盘点2019,其中诸多新变化也非常醒目, 比如中国AI论文发表数除了全球领先——还首次超越欧洲,AI专业受到空前热捧,清华AI课程注册3年翻4倍。

    量子位
  • NLP研究入门之道:如何通过文献掌握学术动态

    本期推送第四篇:如何通过文献掌握学术动态,感兴趣的同学可以直接在Github上阅读。

    代码医生工作室
  • 谷歌2019 学术指标发榜:CVPR首次进入Top 10,何恺明论文引用最高!

    本次发布涵盖2014-2018年发表的文章,并包括了截至2019年7月在谷歌学术中被索引的所有文章的引用 。

    新智元

扫码关注云+社区

领取腾讯云代金券