前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >BBC最新纪录片数据之欢(下):美女数学家讲述数据的前世今生

BBC最新纪录片数据之欢(下):美女数学家讲述数据的前世今生

作者头像
大数据文摘
发布2018-05-25 16:36:39
6870
发布2018-05-25 16:36:39
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘作品,转载具体要求见文末

字幕组:卫青 陈啸明 狗小白 白丁 YU 崔云柯

一位名叫汉娜的美女数学家,曾经在TED用数学论证了数学告诉你,完美伴侣如何选择(点击链接查看ted演讲),而最近,她和BBC刚刚拍摄了一部制作精美的关于数据的纪录片《数据之欢(The Joy of Data)》。汉娜教授也亲自上阵出境,从data的词语来源讲起,娓娓道来了信息/数据的产生到如今的发展,以及我们身边的数据是如何影响我们的。

上周文摘推送了数据之欢(上)(点击查看),简单来说就是,这位美女数学家先后遇到两个小伙:马克发现你点击任何维基百科词条的第一个链接,并为接下来的每一页一直重复这个动作结果会呈现出一个固有的模式;艾尔·梅尔用自己编写的程序研究这个模式发现,百分之九十五的维基百科页面,最后都会回到"哲学"。

这揭示了一个隐藏的数学结构,因为维基百科就是一个藏满了链和环的网络,它可以被数学很好的描述对我来说这是对平行宇宙的完美例证。

一个宇宙有形、吵杂、散乱,你可以看到摸到、感知到它;另一个宇宙以数学形式存在,我们认知的关键正在于此,而数据则是这两个宇宙之间的桥梁。

接下来就让我们继续跟着汉娜老师,听听上次她没有说完的故事。

↓↓↓

视频时长31分钟,建议在WiFi条件下观看。

暂时无法观看的同学可以直接下拉查看文字版摘要。

视频内容

注:本纪录片分上下两部分,本文推荐下部,上部可点击文末阅读原文查看。

什么是信号?

在某种意义上它是不确定性的减少,接收到信号意味着更少的不确定性,比起从前 从另一个方面考虑 衡量和量化信号,是不确定性的变化。

世上最大范围

关于普通人的数据材料的研究

对世上最大范围关于普通人的数据材料的研究,就是伦敦中央刑事法院老贝利,英格兰和威尔士的\N中央刑事法院。自1674年至1913年,共审讯了近20万个案件,每天有近1.27亿个词出自孤儿、女人、仆人,以及无所事事的游民,当然还有罪犯,以及社会上形形色色各个阶层的人的口中。这就使得它与众不同,老贝利的数据从规模,深度、重要性来说,其令人激动之处,不仅在于我们能从中检测到某个信号,在于我们能够观测\N这个信号随时间变化的出现情况。

想象一下你走进一间法庭,每次你听见一个单词,我们都将问你这个词蕴含着多少,关于这个被审判的罪案的信息量?你听见一个词"这个",所有案件里这个词都差不多 基本给不了任何信息,大部分你听见的词对所发生的事情都给不了有用的信号,但之后你听见了"钱包",这就包含了有用的信息。紧接着是"钱币""抢"和 "撞击",单词出现频率越低 蕴含着越丰富信息量,也使这个词的信号意味越明显。我们在老贝利里看到的最清晰的信号之一,其中最明晰的过程之一,就是人们所说的的文明化进程,也就是人们越来越关注暴力与非暴力案件之间的区别。

我们利用手中的技术

塑造属于我们的未来

当大数据和人工智能双剑合璧的时候,很多人对此感到忧心忡忡,这是完全可以理解的。但是就我个人来说,任尔东西南北风,核心问题永远岿然不动,不论你是维多利亚时代伦敦的威廉·法尔想要破解霍乱的迷局,或是身处布里斯托尔市的一栋已经联网的房屋内,你的目的无非是解读数据模式,数学语言就是你的工具。毫无疑问,机器能帮助我们把模式识别出来,但是发现其背后意义的,是我们人类,我们的关切应当在于,通过这些智能技术我们想要实现的那些目的,而不是这些技术本身。我们利用手中的技术塑造属于我们的未来,技术本身可做不到这一点

关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 |bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-02-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档