BBC最新纪录片数据之欢(下):美女数学家讲述数据的前世今生

大数据文摘作品,转载具体要求见文末

字幕组:卫青 陈啸明 狗小白 白丁 YU 崔云柯

一位名叫汉娜的美女数学家,曾经在TED用数学论证了数学告诉你,完美伴侣如何选择(点击链接查看ted演讲),而最近,她和BBC刚刚拍摄了一部制作精美的关于数据的纪录片《数据之欢(The Joy of Data)》。汉娜教授也亲自上阵出境,从data的词语来源讲起,娓娓道来了信息/数据的产生到如今的发展,以及我们身边的数据是如何影响我们的。

上周文摘推送了数据之欢(上)(点击查看),简单来说就是,这位美女数学家先后遇到两个小伙:马克发现你点击任何维基百科词条的第一个链接,并为接下来的每一页一直重复这个动作结果会呈现出一个固有的模式;艾尔·梅尔用自己编写的程序研究这个模式发现,百分之九十五的维基百科页面,最后都会回到"哲学"。

这揭示了一个隐藏的数学结构,因为维基百科就是一个藏满了链和环的网络,它可以被数学很好的描述对我来说这是对平行宇宙的完美例证。

一个宇宙有形、吵杂、散乱,你可以看到摸到、感知到它;另一个宇宙以数学形式存在,我们认知的关键正在于此,而数据则是这两个宇宙之间的桥梁。

接下来就让我们继续跟着汉娜老师,听听上次她没有说完的故事。

↓↓↓

视频时长31分钟,建议在WiFi条件下观看。

暂时无法观看的同学可以直接下拉查看文字版摘要。

视频内容

注:本纪录片分上下两部分,本文推荐下部,上部可点击文末阅读原文查看。

什么是信号?

在某种意义上它是不确定性的减少,接收到信号意味着更少的不确定性,比起从前 从另一个方面考虑 衡量和量化信号,是不确定性的变化。

世上最大范围

关于普通人的数据材料的研究

对世上最大范围关于普通人的数据材料的研究,就是伦敦中央刑事法院老贝利,英格兰和威尔士的\N中央刑事法院。自1674年至1913年,共审讯了近20万个案件,每天有近1.27亿个词出自孤儿、女人、仆人,以及无所事事的游民,当然还有罪犯,以及社会上形形色色各个阶层的人的口中。这就使得它与众不同,老贝利的数据从规模,深度、重要性来说,其令人激动之处,不仅在于我们能从中检测到某个信号,在于我们能够观测\N这个信号随时间变化的出现情况。

想象一下你走进一间法庭,每次你听见一个单词,我们都将问你这个词蕴含着多少,关于这个被审判的罪案的信息量?你听见一个词"这个",所有案件里这个词都差不多 基本给不了任何信息,大部分你听见的词对所发生的事情都给不了有用的信号,但之后你听见了"钱包",这就包含了有用的信息。紧接着是"钱币""抢"和 "撞击",单词出现频率越低 蕴含着越丰富信息量,也使这个词的信号意味越明显。我们在老贝利里看到的最清晰的信号之一,其中最明晰的过程之一,就是人们所说的的文明化进程,也就是人们越来越关注暴力与非暴力案件之间的区别。

我们利用手中的技术

塑造属于我们的未来

当大数据和人工智能双剑合璧的时候,很多人对此感到忧心忡忡,这是完全可以理解的。但是就我个人来说,任尔东西南北风,核心问题永远岿然不动,不论你是维多利亚时代伦敦的威廉·法尔想要破解霍乱的迷局,或是身处布里斯托尔市的一栋已经联网的房屋内,你的目的无非是解读数据模式,数学语言就是你的工具。毫无疑问,机器能帮助我们把模式识别出来,但是发现其背后意义的,是我们人类,我们的关切应当在于,通过这些智能技术我们想要实现的那些目的,而不是这些技术本身。我们利用手中的技术塑造属于我们的未来,技术本身可做不到这一点

关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 |bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2017-02-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏玉树芝兰

你到底该信谁?

2016年,微信覆盖人口超过了8个亿,这意味着什么?意味着我们被刷屏的几率越来越高了。

841
来自专栏VRPinea

这家硅谷华人精英组成的MR硬件团队,为践行极客精神到底做了哪些事?

3526
来自专栏逍遥剑客的游戏开发

VRMMO的技术挑战

5679
来自专栏华章科技

购物篮分析:绝不只是“啤酒与尿布”!

之前的两篇实用性文章《网购评论是真是假?文本挖掘告诉你》和《大数据助力东北小吃铺满血复活》发表之后,许多读者表示对其中的“购物篮分析”很感兴趣,希望我们能多做介...

1616
来自专栏腾讯音视频实验室

腾讯音视频实验室杰出科学家刘杉:我们处于视频编解码标准制定的起点,而非终点。

2017年12月28日,由腾讯社交网络事业群(SNG)主办TSAIC学术&工业交流盛会在腾讯滨海大厦举行,150余位来自麻省理工、斯坦福、卡耐基梅隆、清华、中科...

54510
来自专栏互联网杂技

你必须知道的4条设计黄金原则

子曰:“三人行,必有我师焉;择其善者而从之,其不善者而改之。” ? 如果你曾在纽约找过公寓,那么你一定会了解这是一个非常独特的地狱般的折磨。 在经历了多方面...

3458
来自专栏腾讯高校合作

【犀牛鸟·视野】现场报道 | SIGGRAPH Asia 2017 (DAY 1):AR/VR让空间变得更智能

SIGGRAPH(Special Interest Group for Computer GRAPHICS)是由ACM SIGGRAPH(美国计算机协会计算机图...

37110
来自专栏知晓程序

【晓周报】教育部官方小程序发布/公众号测试「标题党标记」功能/「微信热词」功能推出

从今天开始,知晓程序会在每周一,为你带来全新的「晓周报」栏目。 在「晓周报」里,你可以简单了解上周微信小程序的新能力、新动向。

1313
来自专栏程序人生

Pixel 2 XL,软件为王

在用了六年多 iPhone 后,程序君对 iOS 系统已经深深地审美疲劳,累觉不爱。 新出的 iPhone X 噱头不少,从功能上来看让人大失所望。正好,pix...

3246
来自专栏CDA数据分析师

微软How old 侧颜值,今天你测了吗?

话不多说,先上图! ? 郭德纲赤裸裸被微软鄙视了。\(^o^)/ 以下是正文部分,逗个乐先! 微软靠颜值测年龄网站爆红 背后原理大揭秘 近来脸书...

2056

扫码关注云+社区