吴伯凡对话吴军、涂子沛：大数据是智能的母体

大数据文摘

发布于 2018-05-22 14:48:30

4560

发布于 2018-05-22 14:48:30

文章被收录于专栏：大数据文摘

大数据文摘记者|蒋晔

智能能给普通人带来什么？语音识别什么时候才能真正实现？

◆ ◆ ◆

摘要

2016年11月13日，第二届万物互联创新大会「创业下一潮水：大数据与智能时代」在杭州召开。“铿锵三人行”环节请到了硅谷风险投资人、《智能时代》的作者吴军博士，观数科技联合创始人、前阿里巴巴集团副总裁涂子沛先生，以及伯凡时间创始人吴伯凡先生，并针对大数据和人工智能相关话题进行了探讨。

大数据文摘记者带来现场第一手报道，以下为对话原文，在不改变原意的前提下有部分删改：

◆ ◆ ◆

大数据和人工智能的关系

吴伯凡：今年三场黑天鹅，AlphaGo取胜，英国脱欧，以及川普当选美国总统，这里都有一个很重要的问题，就是智能预测。第一个问题，大数据和人工智能到底有什么样的关联，区别显而易见，关联是什么？

吴军：这一次川普和希拉里竞选，希拉里是一个什么样的势态，传统营销能够想到的办法，砸钱、铺广告位，找意见领袖、代言人，就是好莱坞的，传统方法全用上了，但是不产生结果。为什么呢，很多程度上过去这种传播方式，一个单点到多点的传播出来以后，什么结果不知道，接下来该怎么调整，不知道。

今天大众每一个人都是制造思想想法的这么一些人。通过移动互联网，大家互相抱团，一个个小社区。有这么一些人，他们的思想很相近，这些意见在过去淹没在汪洋大海之中没有人知道。支持川普很多人就是这样的，在今天看来这是一群很奇怪的动物，千奇百怪的想法，在过去媒体时代根本体现不出来。

今天，到了大选前几天，在facebook上，这些大数据的体现，好像facebook已经能够感觉到味道不大对了，虽然传统媒体都清一色说希拉里能够当选。在社交媒体上好像反映出要变天了，从这个角度来看也不完全是“黑天鹅”。就像在座各位参与到了大数据时代，智能时代之中了。这是我的看法。

涂子沛：伯凡的问题是大数据和智能有什么关系，我们简单的说，直接回答就是大数据是智能的基础，大数据是智能的母体。我用了一句比较性感的话来说，大数据是智能的土壤。也可以简单的这么说，没有数据就根本不会有智能，所有的智能都是建立在数据的基础之上。

我要来看，过了互联网时代之后是大数据时代，智能时代其实还是大数据时代的一个组成部分，一个巅峰。刚刚谈到今年美国大选，我们在关注大洋彼岸的选举，大家有没有关注浙江发生的事情，5月份阿里淘宝上就看到了和希拉里，川普的各种宣传旗帜出货量，川普是希拉里的5倍。

义乌人民说川普的货不要定金都敢做，而希拉里不行，所以数据是什么。刚才我们说数据是目前预测未来最有效，最有力的工具，因为数据表述的是过去，记录是过去的事情，但是表达的是未来，它告诉我们未来，因为整个世界是有因果关系的。黑天鹅是怎么来的，美国是怎么解释，我觉得可以看义乌。

吴伯凡：涂总是数据的代言人，吴军老师是智能时代的代言人，你认为涂总说的数据是大脑，智能只不过是一个延伸，你同意这个观点吗？

吴军：我同意，机器获取智能的方式和人不一样，它很大程度上靠数据。关键的是，机器获得智能在哲学层面和人还是有很大差别，人是强调逻辑推理，很严格导出知识。而机器某种程度上来说是一步到位，因为有这个数据一步到位，通过相关性直接找出知识，它对我们的认知是挑战。过去我们说要知其然，知其所以然，在计算机不是这样的，它知其然，不知所以然。你对这个结论用还是不用，信还是不用。举个例子，比如阿里的好多商品，包括亚马逊很多商品，它之间的关联，你根本说不出是什么原因的。但是你把这两个商品房在一起去卖，结果就是好，实际上这对过去人的认知也是一个蛮大的挑战，所以数据可以讲是机器智能的一个基础。

◆ ◆ ◆

大数据的相关性与因果关系

吴伯凡：知其然，不知其所以然，万物都是有因果关系的，基本关于大数据的尝试，大数据是相关关系，不是因果关系，这个怎么解释？

涂子沛：吴军早上说到一个案例，沃森看病，沃森看疑难杂症比普通病还准确，为什么？我觉得这个问题在某个阶段可以去回答伯凡先生的问题，为什么这么讲呢，我其实还是相信因果性。相关性是没有因果的相关性，我们一定要验证这种相关性之后，才证明它是科学的。

比如伯凡说很多东西摆在一起，它们就是会卖得更好，它们有原因吗。啤酒和尿布是最经典的认知，开始沃尔玛也搞不清楚原因，啤酒和尿布摆在一起，双双销量都上升呢。它是有真实原因的，每一个最后有价值的相关性，它是有因果性的。如果没有价值的相关性，它背后这个因果性是不成立的。

◆ ◆ ◆

吴伯凡：有时候我们做决策时没有必要追溯因果，来不及。

涂子沛：对，我一定程度上同意，从数据上看相关性，我们一分析，杭州啤酒销量和硅谷犯罪率是相关的。这在数据上完全可以出现的，那我们怎么去解释。

吴伯凡：这个问题很深刻，过去说的雄鸡一唱天下白。大公鸡每天一叫，天就亮了，人们就认为天亮是被它叫亮了，实际上没有因果关系。我们听见鸡叫了，一会天亮了，这个我们可以用。这个问题思辨，大数据与思辨。

涂子沛：我认为这个东西已经上升到哲学层面，因和果，我们永远说不清楚。说了果，前面有因。因又是另外一个事情的果，整个事件是错综复杂，上升到哲学层面。最终解决这个问题，一定程度上是数据解决了这个问题。

吴伯凡：最近大数据不像前几年那么火，最近谈人工智能比较多。但是大数据，大家已经往深处在挖掘。比如最近我看到好几篇文章在谈林彪与大数据的关系，说林彪是一个数据分析的高手。

涂子沛：我相信这个例子来自于我的书，我是中国最早讲这件事的人。其实延伸过去，军事战争对数据的应用是非常密集的。为什么？因为数据就是情报的载体，就是信息的载体，所以他要收集数据。

这个故事说什么呢，说林彪他有一个很好的习惯，什么习惯？他时刻兜里带一个小本子，他见到什么东西，有人报告什么东西，他就记下来。记下来干什么，他把所见所得变成数据，一到决策的时候他什么情况就知道了。

我们今天要看，刚刚说了无数据无智能，事实上还有一个东西，在管理学上来说无数据无决策。我们所有的决策事实上建立在情报收集基础上，今天的情报是什么，今天的情报就是数据，不是其它的东西。

◆ ◆ ◆

智能能给普通人带来什么

吴伯凡：数据如果是一个情报的话，为我们提供了做决策的依据。但智能好像关心的还是数据，普通消费者关注的就是智能，智能无非让每个人都当上官，有秘书，有司机，吴老师怎么看待这个问题？

吴军：发展机器智能还要有医生，任何科技最终目的就是为了你的生活变得更好一点，这是终极目标。延年益寿，医疗，刚才很多人都讲到医疗，还有出行各方面要方便，要有人替你管理这些事。最好这个计算机足够聪明，把你的时间省下来，自己干一些喜欢的事，安排你日常活动的这些事，让他去干了。

以前最早是像林彪似的用一个小本子，用一个手册。然后就变成了你的日历，计算机上了。以后像日历，它可以管理得很好，涂老师、吴老师给我打一个电话，什么时候在这里搞活动，等等安排，我跟工作人员的邮件来往、微信来往，完完全全记下，严格来讲用科大讯飞理解语言的部分都记下来了。

久而久之，哪些活动，这么多活动，吴老师的活动，他做的内容和我写的有相似性，我可能会接受。或者涂老师刚才讲到数据和智能是相关的，所以他邀请的活动，我可能参加。另外有一个什么八竿子打不着的，根据以前习惯就拒绝了。它每天在整理决策优先级的时候，事先排好序了等等，就是很小的例子。

这些东西也是从数据到智能，这是我们生活的便利性。它知道我每天工作安排时，以后也不用我天天打电话给滴滴，或者易到用车，今天6点50在哪儿等我，这个时间是自动安排好了。到了6点50我该出门时，车已经准备好了，当然有无人驾驶。未来我们想象一个生活场景有极大的方便性，我们到时候能够腾出非常多的时间去思考问题，来发动人脑的特征。

◆ ◆ ◆

语义识别什么时候能实现

吴伯凡：还有一个听话听音，察言观色。就像现在说的例子，野蛮女友和男朋友打电话，你要是到晚了，没有到，你就等着。我要是到了，你没有到，你就等着；我要是到了，你不等我，你就等着！这个智能可能就无法理解，吴老师你觉得什么时候能够实现？

吴军：刚才我看讯飞的，基本上没有挑出什么错误，这个还可以。理解，这里有两个难点。第一，本身绕口令，计算机比较容易解决这个问题。一个是它理解上下文这个意思，同样说一句话，我就表达一般的陈述，可能是个反意。那我得看前面是个什么场景，这是一个常识或者人生活的知识，这是计算机现在，我还看不到一个前景。我今天说十年，我说错了，十年后你也不会找我。大概在这么短的时间内，我觉得这个事还不能最好的解决。

最典型是在北京公共汽车上，你踩了一个北京40多岁的女同胞。踩了她一下脚，她会跟你说这么一句话，没硌着你的脚吧，她其实是怪你踩着他的脚了。第二，刚才讲的善解人意这件事，数据叠加之后会改进得非常快，包括航班今天晚了，发现哪儿有车祸，堵车了，让你今天早走半小时。甚至闹钟提前闹醒半小时，这个事做起来会是比较快。一般生活上的善解人意，这件事能够比较快，可能有个三到五年，生活助手应该能解决。

◆ ◆ ◆

便利VS隐私

涂子沛：我补充两个案例，今天人工智能到底在做什么，今天人工智能在做一些重复性的工作，帮助人类从这些工作当中解脱出来。

我原来在美国的时候都用Gmail邮箱，有一次我的朋友在家里给我写了一封信，从中国来到美国，什么时候抵达。到了那个时刻我就准备开车出去接人，这时候我收到了Googleplay发出的信息，说这班航班晚点了，我当时就惊讶。Google在读这些邮件，读这些邮件之后给你提供个性化的服务，可能会牵涉到另外一个问题，伯凡会感兴趣，就是隐私。

如果你说要做到察言观色，就必须读懂你的每一句话，这就是问题。当时我接到这条短信的时候非常惊讶，但我认为这条短信非常有用，为什么？我正准备出门，你说有用没有用，那当然有用。我们的一个结论，我们今天享受这种人工智能的便利，事实上是让度了我的一份权力。

这是我们说的第一个案例，第二个案例就说到AlphaGo。AlphaGo确实是计算机打赢了人类，但是我很快看到网上有段子，有什么段子呢，他说那是下围棋，你打打麻将试试看，我抓一下头发，揪一下耳朵，那就有配合了，我们会察言观色，计算机不会。

◆ ◆ ◆

技术的可能性和商业的可能性

吴军：触一下耳朵打麻将，也不是说做不到，因为你把视觉这些都加进去也能够做到，是成本的问题。之所以不做，商业上很多事不做是因为没利可图。像刚才涂老师讲的，提供一个航班晚点的信息，这个事以后你会更加相信我给你的推荐，它有一个商业逻辑在后面，这是比较好的。包括AlphaGo下棋这件事，是非常好的宣传。

如果哪天说打麻将，给你监测场景，你们大家如果觉得有用，它就会去做，你们大家要觉得没用就不会做。包括无人驾驶汽车也是，我们过去说眼观六路，耳听八方，过去好多事情发生了计算机监测不到。实际上它现在每秒钟各种传感器，几十种数据传进来，这个察言观色，像无人驾驶汽车出错率比人类还好一些。很大程度上做到做不到，看你砸多少钱了。

吴伯凡：这就是一个问题，技术的可能性和商业的可能性，成本的问题有没有人买单，厂商有没有利益的问题，很多技术实际上早就已经有了，但是它没有办法找到一个市场，所以就搁置了。刚才我看到前面一个演讲，一个词叫“部分辅助性智能”，可能我们下一步看到的无人驾驶汽车，就是那种老人车，货场和机场里固定场景，固定道路的，这种无人驾驶车率先会进入市场。那种高智能走盘山公路的车，可能到很晚才会出现。

吴军：无人驾驶要分六个阶段，第一是特斯拉，辅助驾驶，但还是人驾驶。第二个阶段，它驾驶，人监控。接下来有些分场景的，就是从小区到地铁站，每天只走这一条路，这个比较容易。再往后一个阶段，比如说你可以全市走，但最好晚上10点钟之后再上路。最后一个阶段，Google现在做的，没有条件限制，所以每个公司切入点不一样。特斯拉是切入第一个点，几个主要汽车厂，奔驰、宝马是切入第二个点。吴老师基本上切入三四个点，比如园区里、商场里，小区和地铁站之间的，各家目标也不太一样。

涂子沛：这是一个纬度，从技术本身来讲有这些发展阶段。但是我认为今年事实上是一个点，技术怎么去发展，怎么去提高，它最终市场结果就是大众接不接受，这是一个点。

今年AlphaGo战胜人类的围棋冠军就是一个转折点，这意味着越来越多的人接受智能。比如说吴军博士上午讲的例子，我认为也是很有借鉴意义的。他提了两个，第一，推荐。今天网站上很多东西，亚马逊上40%的销量是由于推荐，你不买这个东西，你没有说要买这个东西，我向你推荐最后成交了，40%的东西都是这么卖的，推荐。

他又讲了一个，沃森。我们要问的一个问题，计算机推荐一件衣服给你，你就买了，这不是问题。如果计算机推荐一个药给你，你就吃了，我认为这是一个问题。他上午说了三个数据，你的症状，你的历史，还有化验结果，有这三个数据提交给计算机，如果未来在手机上提交。手机告诉你该吃什么药物，你敢吃吗。如果你敢吃，我认为就是人工智能又一大跃升。

◆ ◆ ◆

吴伯凡：秘书、司机、医生，医生是最难的。

吴军：还有第四个，可以给你推荐老婆。以色列做了婚配的工具，犹太人做的，他的推荐准确率特别高。不光是犹太人去用这个，美国很多白人也去用这个。他说人类找老婆有一个特大的误区，女的找男的也有一个特大的误区。比如他是一个60分的男性，他想象女神是95分的。95分女神都不会看他一眼，他最高目标就是70分的，能找着这个就不错了，当然他对20分的也不会看一眼。

他做了什么事呢？把每个人重新做了画像，他不让你看到所有人。比如你是一个60分的，他让你看到最好的就是70分。这个60分，70分不是说长相，是各方面综合评估。这个成功率非常高，而且回访以后，他们的日常生活满意程度还很高。因为他找一些内在价值，不是外在的。60分一定要找95分的，最后你有钱也能办到，但最终差异是很难弥补的。当最后说找老婆这个事也不是你自己筛选，不是你自己的意愿，是机器在给你做，这个很有意思。

◆ ◆ ◆

机器会撒谎吗？

吴军：人有一些善意的撒谎，这个机器现在很难做到。

涂子沛：人类会撒谎，机器不会撒谎。图灵测试中存在这样的悖论，人会撒谎，到底能不能骗过他，这个图灵测试，吴老师你怎么看？

吴军：机器撒谎是很容易的，只是说你有什么顾虑，机器没有顾虑。AlphaGo赢李世石很容易，让它故意输棋不容易，故意设两个BUG，让它输棋是容易的。如果为了什么利益，为了赌博，中国的足球，要挣钱，要赌博，那就可以设计输棋了。但是善意的撒谎，这个是揣摩圣意，随便撒一个谎，今天天晴天阴，这个事很容易撒谎。

涂子沛：察言观色，人类有这种厉害之处，相比于机器。察言观色正是撒谎的基础，因为机器不会察言观色，它就不会撒谎。察言观色意味着你要去迎合，扭曲事实，机器不会。从这个角度上讲，我觉得未来人工智能世界还更靠谱一些。比人类管这个世界海更靠谱一些，因为机器不撒谎。

吴伯凡：人工智能的科幻电影里，一个丈夫车祸死了，可以根据他过往所有数据，用软件合成成一个真实的人，而且把这个女的对丈夫不好的评价知道以后，比如说他的脾气原来不太好。

涂子沛：这也是图灵测试，这个妻子最后能不能判断这个丈夫。

吴伯凡：越聊越多，人工智能，大数据，吴军老师说的第四点婚配，司机、秘书、医生，如果我们不当官，不有钱有势也能够拥有这三个，那对我们未来的的确确是一个福音，由此看来也的确是一个大产业，人人都拥有私人医生，拥有司机、秘书的时代。

◆ ◆ ◆

寄语

吴军：这是一个非常有希望的时代，这是一个最好的时代，也是一个最坏的时代。因为好坏是看你站在哪个角度，你是否参与了，你参与进来，对你来说就是一个最好的时代。你如果拒绝这件事情，可能对你来讲未来是一个很坏的时代。

涂子沛：我们要更多适应和机器共存共生，越来越多的依赖于机器。但是这并不是代表我们去否认艺术，其实吴军开始演讲的PPT，我记得很清楚，一开始弹钢琴很好的人最后成为了人工智能的专家，我认为还是要在这当中找到一个平衡。大数据会给你很多建议，告诉你怎么找到自己的另外一半，什么样的人才适合你。但是如果没有你自己的体验，没有每一次约会的心跳，没有那种察言观色所带来的愉悦感，或者说恶作剧感，小小的使坏，我相信这个世界的吸引力也会大大的下降。人之所以为人，还是要善用数据，善用智能，它归根到底还是工具。本质上，我认为这个世界上最可爱的东西还是人，还是人性，不是机器，只是我们要适应它。

感谢主办方提供速记及图片

大数据文摘记者|蒋晔

关于转载如需转载，请在开篇显著位置注明作者和出处（转自：大数据文摘 |bigdatadigest），并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑，可直接转载，转载后请将转载链接发送给我们；有原创标识文章，请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者，我们将依法追究其法律责任。联系邮箱：zz@bigdatadigest.cn。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2016-11-20，如有侵权请联系 cloudcommunity@tencent.com 删除

大数据

人工智能

本文分享自大数据文摘微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

大数据

人工智能

登录后参与评论

0 条评论

热度