最近比较火的10篇大数据文章,看看你错过了哪篇?

翻译 | AI科技大本营(rgznai100)

参与 | Shawn

Sicara团队精挑细选,了10篇在今年7月发表的大数据相关文章(Sicara是一家从事Agile数据开发的公司,总部位于巴黎),我们一起来看一下把。

本文相继刊载了一些实用文章、科研论文讨论以及几篇与商业和科学有关的数据科学和信息架构(IA)论文。(文章排名不分顺序)

另外还登载了一篇描述一场早期人机大战的文章(不是象棋竞赛;这篇文章排在名单的第5位)。

SO,enjoy!

1 .《如何教机器自动编程?——NEAT学习》(How do we teach a machine to program itself? — Neat learning) 作者:Murat Vurucu

Murat Vurucu 在这篇论文中,用简单的措辞和实例解释了一种名为“NEAT”的新方法。

NEAT通过按照特定规则对现有神经网络进行整合的方式,生成了新的神经网络,这些特定规则是受遗传学启发而归纳出来的。

这篇文章的唯一问题是:“neat”这个词并不双关,不包含“简洁”这层意义。

原文地址: https://medium.com/towards-data-science/how-do-we-teach-a-machine-to-program-itself-neat-learning-bb40c53a8aa6

2.《基于树的学习算法实用指南》(A practical guide to tree based learning algorithms) 作者:Sadanand Singh

你还在搜寻既实用又详尽的基于树的学习算法教程吗?别找了。这里有一本深入的教程,堪比增强版的Udacy,理论、彩图和代码示例在这里应有尽有。

该教程的作者Sadanand Singh还写过一本关于支持向量机(SVM)的类似教程,可点通过链接(https://sadanand-singh.github.io/posts/svmpython/)阅读该教程。

原文地址 https://sadanand-singh.github.io/posts/treebasedmodels/

3.《设想一下:通过重新组合熟悉的视觉概念来创造新的视觉概念》(Imagine this: Creating new visual concepts by recombining familiar ones)

符号→图像 图像→符号

“白色”手提箱 “帽子,橙色地板,品红色墙壁”

Deepmind发表的最新研究成果,宣布其在开发可以概括自身学习的算法的过程中,取得了新进展。

在这项研究当中,研究人员模仿了婴儿的学习方式——借助口头提示观察物体,并从中得出含义。他们成功地展示了对一些颜色和物体的泛化能力。

我们还发现,研究人员在架构中使用了无监督学习,这点尤为有趣。这篇论文绝对与《深度学习的未来》(名单中的第6篇论文)相得益彰。

原文地址 https://deepmind.com/

4.《计算机阅读肢体语言》(Computer Reads Body Language) 作者: Byron Spice

机器学习系统的工作方式是,利用一台摄像机学习如何实时识别肢体语言,只需一台笔记本电脑,可以识别十几个人的肢体语言。

曾经,微软面向Xbox 360娱乐平台推出了体感游戏设备Kinect,但这样的光辉岁月似乎早已终结。

现在,卡内基梅隆大学的研究人员使用一种类似Kinect的精准肢体映射来训练他们的AI系统。它的输入是一台摄像机记录的即时影像,而更为准确的数据则作为地面真值。

该AI系统成功地对其训练作出了正确概括,所得结果也相当出色。研究人员已将他们的代码以开源的形式公开了出来。在查看代码之前,一定要看一下链接视频(地址:https://www.youtube.com/watch?v=LrCO8QcXfAY)

原文地址 https://www.cmu.edu/news/stories/archives/2017/july/computer-reads-body-language.html

5 .《人机对决》(How checkers was solved) 作者: Alexis C. Madrigal

在Deep Blue与Garry Kasparov大战,AlphaGo对决李世石之前,最早的一场人机大战是世界顶级跳棋大师Marion Tinsley与Chinook超级计算机间的战局。Alexis C. Madrigal在这篇文章中饶有趣味地描述了90年代初期的这场人机对战。

这篇刊载在《大西洋月刊》上的文章不仅探讨了程序员和棋手的心理,还为了解机器学习当前取得的进步提供了启发。另外,这篇文章对读者文学素养的提高也大有裨益。

原文地址 https://www.theatlantic.com/technology/archive/2017/07/marion-tinsley-checkers/534111/

6 .《深度学习的未来》(The future of deep learning) 作者: François Chollet

François Chollet在这篇文章中探讨了如何使机器学习模型更加接近于通用人工智能AGI。

此文延续了他之前在《深度学习局限》中提出的想法(这两篇文章都载于作者的《Python深度学习》一书中)。

作者围绕这个主题提出了一些务实的观点,而Agile数据工程师们的工作正离商业和经济价值的实现越来越接近,对于他们来说,这绝对是一篇好文章!

原文地址 https://dev.to/kasperfred/the-future-of-deep-learning

7 .《机器学习中的技术性债务》 (Technical debt in machine learning) 作者:Maksym Zavershynskyi

Maksym Zavershynskyi在此文中简短而深刻地概述了机器学习项目中如何产生技术性债务的问题。

Maksym的论调有些夸张,但是他选择对这样一个鲜有人提及的论题进行探讨,还是十分令人欣赏的,而且Maksym的建议也很有实践价值。另外,Maksym还给出了一些研究相同论题的参考论文。

点击阅读原文 https://medium.com/towards-data-science/technical-debt-in-machine-learning-8b0fae938657

8 .《人工智能正在改变我们进行科学研究的方式》(AI is changing how we do science. Get a glimpse)

著名期刊《科学杂志》在此文中给出了机器学习和AI在科学上的5个应用案例,涉及的领域包括物理学、心理学、生物学、天文学和化学。

我们可以从中了解到,AI技术在前沿科学实验中真的是大放异彩。

《 AI is changing how we do science. Get a glimpse 》——选自《Science Magazine》

原文地址 http://www.sciencemag.org/news/2017/07/ai-changing-how-we-do-science-get-glimpse

9 .《我有数据,我需要理解这些数据,应该从哪里开始?》(I have data. I need insights. Where do I start? ) 作者 :Rama Ramakrishnan

如果你从事的是数据科学方面的工作,那么你可能遇到过这个问题:大多数人不知道从哪里开始研究。

Rama Ramakrishnan认为,我们应把一个业务看作一个黑箱来探索。如果你是一名数据科学家,在研究数据之前,你应该先问自己希望看到什么样的数据。

原文地址 https://medium.com/towards-data-science/i-have-data-i-need-insights-where-do-i-start-7ddc935ab365

10 .《当前可作商业用途的人工智能工具列表》(A list of artificial intelligence tools you can use today — for businesses) 作者:Liam Hänel

如果有人告诉你,人工智能目前仍然是实验室的事儿,你就给他看看这个名单。

目前,人工智能在商业上的应用越来越广,Liam Hänel 从不同领域中选出了数百家应用人工智能的公司。这份清单十分强大,而且列出的都是高质量的实用工具。

原文地址 https://medium.com/imlyra/a-list-of-artificial-intelligence-tools-you-can-use-today-for-businesses-2-3-eea3ac374835

本文地址 https://blog.sicara.com/07-2017-best-big-data-new-articles-this-month-acb58d4bb15d

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2017-08-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

机器学习是“炼金术”?

1666
来自专栏新智元

MIT非视线成像“透视相机”:隔墙观物、影中窥人!

2012年,MIT计算机视觉科学家安东尼奥·托拉尔巴(Antonio Torralba)在西班牙海岸度假时,发现他酒店房间墙壁上的杂散阴影似乎不是由任何东西投射...

1465
来自专栏AI研习社

告别五毛特效,AI 轻松再现多层材料质感

在影视作品和网络游戏中,往往需要通过计算机技术制作出大量的虚拟图像,例如建筑、车辆、甚至是河水山峦,从而降低制作成本、保证演员的安全、增强观众或游戏用户的视觉真...

1213
来自专栏机器之心

资源 | CNN入门材料:《解析卷积神经网络——深度学习实践手册》

46410
来自专栏CDA数据分析师

《谁动了我的奶酪》中的粒子群算法

本文为作者郭飞原创,CDA数据分析师已获得授权 1、《谁动了我的奶酪》是讲啥的? 其实这本书是一碗上古的老鸡汤。 故事大概是这样的,有4个小生命,其中有两只老鼠...

2206
来自专栏新智元

AI换脸终结者问世!美国防部推首款AI侦测工具,“反换脸”精度99%!

【新智元导读】美国防部研发出了全球首款“反AI变脸刑侦检测工具”,专用于检测AI变脸/换脸造假技术。如今,以GAN为代表的AI换脸术盛行,相应的人脸检测识别技术...

2082
来自专栏AI科技评论

视频 | 告别五毛特效,AI 轻松再现多层材料质感

雷锋网AI科技评论按:这里是,雷锋字幕组编译的 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。

1322
来自专栏新智元

华中科大骆清铭:开启“脑空间信息计划”,连接脑科学与类脑人工智能

【新智元导读】华中科技大学(苏州)脑空间信息技术研究院启动在即,旨在使工业级高分辨率脑图成为神经科学的标准工具。这一项目由华中科技大学生物医学成像研究者骆清铭领...

4257
来自专栏张红林的专栏

机器学习入门书籍简介

在AIclub看到一篇机器学习入门的文章,回想自己磕磕碰碰走过的弯路,颇有感触,因此对自己从懵懂到稍稍入门过程中看过的教程做一个简单的介绍,希望帮到后来人。

4.4K3
来自专栏量子位

能把晦涩难懂的研究工作讲清楚,Distill就奖你10000美刀

Root 编译整理 量子位 出品 | 公众号 QbitAI 在机器学习研究圈里,大家可能都有这样的赶脚: 大部分从事机器学习研究的人,不太擅长写作,无法清晰地呈...

3256

扫码关注云+社区

领取腾讯云代金券