专栏首页猴子聊数据分析大数据时代,我们应该准备些什么?
原创

大数据时代,我们应该准备些什么?

最近打车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用。 我相信现实生活中,这样忽视人工智能时代已悄然来临的人不是少数,而且还很多。 毕竟,从事数据行业的人连2%都不到,更别说真正理解数据的人了。 你也许会说,人工智能是那么高深的技术,我又不做相关的技术,了解那么多干什么。 其实,今天我们谈的不是什么复杂的人工智能高深技术,请注意文章前面的标题:时代。 是的,我们谈的是一个新时代下的个人选择问题。说的更本质一些,其实是在说,这样一个新时代(人工智能时代),人类的思维发生了怎样的改变?进而,我们思考这种思维改变会给个人未来的成长带来怎样巨大的改变和机会。 进一步,你最后会明白这几个问题的答案: 1)为什么中学老师在许多年之后总是感叹: 最终,真正有出息的,都是当年成绩一般般的... ... 2)从1984年洛杉矶奥运会开始,到尽头,国人关注奥运会已经32年了。当年的金牌得主们,除了李宁和郎平,剩下的谁记得呢? 3)为何以前起作用的死磕思维,在人工智能时代,不是最好的人生策略选择。而理解和解答所有的这些问题的前提是,你要真正明白什么才是人工智能时代的核心? 好了,废话不多说,我们先来看看在没有人工智能之前,人类的思维模式是怎样的? 1.单维度死磕思维 在这之前,计算机并不擅长于解决人类智能的问题,也就是我们现在所说的人工智能。 怎样才算人工智能呢? 真正科学定义这个概念的是电子计算机的奠基人 阿兰·图灵(Alan Turing)

1950年,图灵在《思想》杂志上发表了一篇题为《计算的机器和智能》的论文。在这篇文章中图灵提出了影响至今的图灵测试,现已成为验证机器有无智能的标准判别方法。 图灵测试的原理其实很简单的:就是让一台机器和一个人同时坐在幕后,然后请一个裁判同时与幕后的人和机器进行交流。如果这个裁判无法判断自己交流的对象是人还是机器,就说明这台机器有了和人同等的智能。

简单直白吧,其实很多真正有用的人生道理,也就是这么简单直接。只不过人类天生有喜欢秘密的天性,所以很多人更愿意追逐秘密,而非有用的道理,这也是为何从古至今八卦永盛不衰的道路。 后来,计算机科学家们认为,如果计算机实现了下面几件事情中的一件,就可以认为它有图灵所说的那种智能: 1.语音识别 2.机器翻译 3.文本的自动摘要或者写作 4.战胜人类的国际象棋冠军 5.自动回答问题 当然,今天的计算机已经可以做到这些事情,而且还会超额完成更多的智能问题。 例如2011年,IBM研发的智能计算机Watson参加综艺节目《危险边缘》来测试它的能力,这是该节目有史以来第一次人与机器对决。Watson在前两轮中与对手打平,而在最后一集里,Watson打败了最高奖金得主布拉德·鲁特尔和连胜纪录保持者肯·詹宁斯。Watson赢得了第一笔奖金100万美元。 我们从语音识别这个角度来看下,人类一开始是如何思考解决这个问题的: 首先,能想到的是去了解人的大脑是如何识别语音的,然后让计算机按照人的思路去做。举个例子,就拿我们以前学英语,死记硬背单词和句法,当单词量达到一定程度后,就可以理解外国人的话。 事实上,当时各个大学和研究所的专家们在这个问题上就是这么做的,而且已经死磕了20多年的时间。 主要采用的研究方法就是: 基于语法规则和语义规则,利用人工智能的方法理解人所讲的完整的语句。 这个研究方法的思维就是在数学模型这个单维度上死磕,直到“磕的吐血”为止。 我把这种传统的研究思维方法起了个有趣的名字叫:单维度死磕思维。 按照这种方法,经过20多年的研究,在20世纪70年代初,语音识别这个智能问题解决到什么水平呢? 当时按照这个思维方法做出的最好语言识别系统大约智能识别几百个单词,而且识别率只有70%左右。 同时,面对机器人讲话要清晰,不能有方言,不然机器真识别不了。假如王宝强去说,机器估计会想:这是什么鬼,咋听不懂呢? 这种单维度死磕思维,在很长时间指导人们的行为。现在大部分人也都是单维度思维,最典型的例子就是以前读书的时候老师讲的一句话:学好数理化,走遍天下都不怕。指的就是在数理化这条单维度的方向死磕。

单维度死磕的好处是你可以在某一个领域变的足够强,但是它也有致命的缺点:就是由于你将全部注意力集中在这个维度上,你的视野和见识会很小,往往看不到其他维度的红利。 2.多维度思维 直到一个人的出现,才打破了人工智能研究方法的僵局。同时,开启了人类思维的新时代。 我把他的研究方法称为:多维度思维,而这也正是人工智能时代的核心。 这个人是谁呢? 1972年,康奈尔大学的教授 弗雷德·贾里尼克(Fred Jelinek,1932—2010) 到IBM做学术休假,正好当时IBM想开发出具有人工智能的计算机,贾里尼克就负责起这个项目。

语言识别和机器学习先驱~贾里尼克 他选择解决的问题就是:如何让计算机自动识别人的语音? 值得一提的是贾里尼克原本并不是一位人工智能专家,他其实是一位通信专家。 可能是因为跨界的原因吧,他看待语言识别的角度和先前的人工智能专家都不相同。在他看来,语音识别不是一个人工智能的问题,而是一个通信问题。 贾里尼克认为,人的大脑其实是一个信息源,声音从外界传播到耳朵,一个解码的过程。而大脑从思考到找到合适的语句,再通过发音说出来,是一个编码的过程。 这么一想,贾里尼克就找到通信领域的对应数学模型来解决语言识别这个问题,而彻底抛开了人工智能的那一套做法:单维度死磕。 在找到合适的数学模型后,贾里尼克并像以往一样死磕模型这个维度,而是找到数据这个维度来提高准确度。 贾里尼克的做法是用统计方法和大量的数据来训练模型的。幸运的是,在当时只有IBM具备语音方面的大量数据。 为何只有IBM具备这些条件呢? 在那个年代,IBM在全世界计算机乃至整个IT产业可以说是处于独孤求败的地位。20世纪60年代末,IBM的市值达到500亿美元,占到了美国GDP(国内生产总值)的3%以上。 虽然IBM现在市值下滑很严重,也在做大数据方向的转型,但是不可否认IBM仍然是一家伟大的公司,未来价值也巨大。 贾里尼克的团队花了4年的时间,就开发了一个基于统计法和大数据的语音识别系统,它的语音识别率从过去的70%左右提高到90%以上,同时语音识别的规模从几百词上升到两万多词。 这样语音识别就有了本质的飞跃。从此,语音识别就能够从实验室走向实际应用了。

贾里尼克在研究语音识别时,无意中开创了一种多维度(统计+数据)的方法解决智能问题的途径。由于这种方法需要使用大量的数据,因此现在又被称为数据驱动方法,这也是现在大数据解决问题的思维办法。 不在数学模型这一个维度上死磕,而是通过大量数据这个维度来解决以往解决不了的问题。这种方法最大的好处是,随着数据量的积累,会变得越来越好。 李开复就是在这样的背景下,在传统的人工智能实验室里,采用这种多维度的方法开展他的博士论文的工作,并且最终和洪小文一起构建了世界上第一个大词汇量、非特定人、连续语音识别系统。 随着互联网兴起之后,数据的获取变得非常容易,所以大数据的这种多维度研究方法也变的流行起来。 可以说,贾里尼克开启了人类思维的一个里程碑:多维度思维。 基于多维度思维,我们可以分析数据中多个维度的相关性,往往可以获得意外的收获。 就拿我自己的经历来说,之前我为客户做女性购物数据分析的时候。在分析之前,大家普遍认为网上购物产品页面详情应该不需要太多的字,尤其现在手机屏幕那么小,会造成用户体验差的感受。 但是,经过分析排名前50家店铺的多个维度,我发现这样一个有趣的现象:对于女性网上购物用户,产品详情页面越长,越详细越好。 基于这个分析结果,客户调整了页面展示和营销的策略,从而提高了店铺的销售额。 3.什么是人工智能的核心? 现在我们知道了,从 传统思维方法 到 人工智能新思维方法 的出现,人类其实是经历了一个很长时间的思维转变。而这个思维也成为现在大数据时代的核心: 单维度死磕思维 -> 多维度思维 只有深刻认识到这个时代思维转变的核心,我们才能彻底从大脑认知底层理解:为什么个人在这个新的时代,适应转变成多维度跨界思维变的那么重要? 因为,在任何一个单一的维度上,能做到“第一”的只有一个人,只有少数人“名列前茅”,剩下的绝大多数都是“落后”。想想,你在自己的领域多久才能超过那个第一,或者名列前茅的人呢? 但如果我们拓展开另外一个维度呢就会完全不同。 我打个比方,你在维度A上打80分,维度B上打60分(勉强及格就可以),两个维度上相乘就是4800分。 现在来看你的竞争对手,在维度A上是90分。 你的4800分和对手的90分比,谁的优势更明显呢?结果很显然,你的多维度更有竞争优势。 你也会明白,实际生活中的人都是立体的,而不是平面的。在单个维度上,大家比的是人生的长度,而在两个维度上,大家的比的是人生的宽度.... ....

进而,你会发现一个新的趋势,现在跨界(多个维度)赚取财富的人越来越多。他们事实上,都知道这样一个秘密道理:跨界能给自己拓展一个新的维度。 说到底,其实是因为时代变了,以前我们用的诺基亚手机都淘汰了,在新的时代,思维不转变就会一直产生这样的问题:为什么我和他的差距越来越大呢? 4.为什么你总是落后? 所以,我们现在知道文中开始那几个问题的答案了: 1)为什么中学老师在许多年之后总是感叹:最终,真正有出息的,都是当年成绩一般般的... ... 由于在学校教育长期实行的是单维度的评价标准(传统的思维模式),使得大部分人只关注学习成绩这个维度。 这在学校的时候其他能力(维度)不足也没有关系,但是步入社会后,就会发现多维度才是竞争的核心。 中学老师之所以感叹,就是因为没有想到,当初竟然不知道人生除了学习成绩之外,人还有很多其他的维度需要扩展。 2)从1984年洛杉矶奥运会开始,到尽头,国人关注奥运会已经32年了。当年的金牌得主们,除了李宁和郎平,剩下的谁记得呢? 李宁除了金牌这个维度,他还增加了商业这个维度。 3)为何在某个技能上死磕,在大数据时代,不一定是最好的策略选择,那什么才是这个时代好的策略? 时代不同了,在人工智能时代,多维度打造竞争力才是更好的选择。单维度能扩展你人生的深度,但是多维度却可以扩展你人生的宽度。 5.你该如何执行多维度策略? 在认知上有了这个概念以后,却不去执行,就好比恋爱的时候知道恋爱的理论,却迟迟没有下手去追。 不去执行,学习再多,也没有用。 那么,如何执行多维度策略,在人工智能时代,打造个人竞争力呢? 首先,我们应该反省下自己擅长的领域是哪些,然后围绕这个领域你可以扩展的维度有哪些。 以我个人为例,我擅长的领域是编程(大概可以打80分),围绕编程这个领域,我扩展了数据分析(大概可以打70分)和写作(可以打60分)。 所以,我的人生维度分析如下:

值得注意的是,图中60分是及格线,我又将它取名叫平庸线因为一个维度没有及格的话,说明你在这个维度上是平庸的,那就不能算作你的维度,因为它分数太低,不起作用。 所以,想让自己不平庸的最直接的办法,就是在有限的维度上提高积累,然后组合打出漂亮的“组合拳”(多维度跨界)。 如果你也想在未来变成一个有竞争力的人,而不被时代淘汰,不妨也画出你的人生维度分析图,去反思该从哪些维度方面去积累和整合资源。 人最可怕的就是不了解自己,在错误的方向努力,而多维度图可以清晰的展示你目前的水平,尽快发现你该努力的方向。 推荐:人工智能时代,你必须要学会这个通用技能

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 当我们谈到大数据时,大数据工程师们谈些什么?

    用户1756920
  • AI时代,谈数据分析时我们要谈些什么?

    根据维基百科的定义,数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数...

    AI科技大本营
  • 说起大数据,大家在谈什么,我们该如何应用?

    我们都听过很多有趣的例子:其中就有著名的红牛,红牛在美国的广告语是"红牛给你双翅膀",可是顾客喝了红牛没能长出翅膀……红牛被诉广告欺诈。红牛同意向2002年1月...

    MavenTalker
  • 小蛇学python(13)当我们拿到数据,该做些什么

    当我们拿到数据集的时候,我们应该做些什么呢?在数据的汪洋大海中,你是否体会到了同在北上广奋斗的人们一样的在午夜的孤寂感?在充实着林林总总的数据表格中,你试图从中...

    用户2145057
  • 干货|大数据时代,我们平时都用哪些大数据平台?

    什么是开放的API? 大数据时代,数据源就是我们让数据产生价值的最重要的对象,对于一个企业来说,其内部在自身业务经营环节当中包括销售、客服、仓储、财务等等一系...

    灯塔大数据
  • AI时代就业指南:大数据工程师到底应该会什么?

    大数据领域包含哪些职位? 在大数据行业中有很多领域。通常来说它们可以被分为两类: 大数据工程 大数据分析 这两个领域互相独立又互相关联。 数据工程涉及平台和数据...

    小莹莹
  • 【数说·大数据圈】当我们谈论“细分”(segmentation)的时候我们在谈论什么

    我们经常听到一些创业者说,“我做的这个产品主要面向XX客户”,有人服务于高净值人群、有人专门面向女性客户群,也有人专注于老年市场......,不同的客户群之间存...

    数说君
  • 这些大酒店用大数据和分析技术对我们做了什么?

    大数据文摘
  • 这些大酒店用大数据和分析技术对我们做了什么?

    酒店和酒店服务业每天在接待数以百万计的旅客,每一个旅客在办理入住手续时自然都抱有不同的期望。满足这些期望是让客人成为回头客的关键,如今酒店和休闲设施运营商日益借...

    小莹莹

扫码关注云+社区

领取腾讯云代金券