第一部分 | NLP的诞生史 《圣经》关于巴别塔的故事 1.从前,巴比伦人想建造一座塔直通天堂。 建塔的人都说着同一种语言,心意相通、齐心协力。上帝看到人类竟然敢做这种事情,就让他们的语言变得不一样。...因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...2.虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢? 机器翻译被视为“重建巴别塔”的伟大创举。...(¬、¬) 故事型常识阅读理解(Story Cloze Test (SCT))是近几年新提出的一个文本理解任务,在这个任务中,给定背景的四句话,我们需要从两个候选句子中选择出哪一个可以被前四句话推导出来...并且因为这些故事是人为干预的,所以保证在涵盖标准答案的5句话中,不会有杂乱无关的信息,所有信息都是为核心故事服务的。来看一个例子: 这些好玩的东西是怎么实现的?机器真的可以代替川普发言吗?
Wells的短篇小说《蚂蚁帝国》改编的电影中的台词。...作为一个信仰犹太教的女性,我有时会想知道AI的兴起对世界宗教的意义何在。根据2012年皮尤研究《全球宗教景观》,全球84%的人有着宗教信仰。...或者,就像巴别塔的故事一样,AI的发展是否会造出一座足够高的塔以直达天堂,引发造物主制造出新的混乱和遗弃?...(译者注:巴别塔是《圣经》中记载,当时人类联合起来兴建希望能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。)...《圣经》中的巴别塔 我没有答案,但我确实希望如果AI真的变得超级聪明,它可以成为造福世界的有益力量,帮助我们变得更“神圣”而不是更弱小——或者至少更充满爱,不管我们是否信仰宗教。
——[马可福音8:37,马太福音16:26] 大约是2007年,大学二年级的时候,我读到了伟大阿根廷作家博尔赫斯于1944年写的一篇著名的短篇小说:《巴别图书馆》。...为了人类的未来,我决心构建人类知识和信息的巴别图书馆。 毕业之后,大概是2013年,我一直在研究一大堆的知识工具。这些软件工具可以帮助学生更快地学习或者帮助科学家更好地找出论文中的内容。...带着这些思考,我在纸上写写画画,居然画出了下面的图形: 但巴别塔的前车之鉴让我重新思考博尔赫斯关于巴别图书馆的隐喻:协议。...巴别塔的故事:当时地球上的人们都说同一种语言,当人们离开东方之后,他们来到了示拿之地。在那里,人们想方设法烧砖好让他们能够造出一座城和一座高耸入云的塔来传播自己的名声,以免他们分散到世界各地。...从古腾堡到人类信息的全球基础设施,已经涌现了很多类似的破坏性技术,而协议实验室的工作,更接近博尔赫斯的巴别图书馆,其结果我们无法完全预测。
阅读字数:2175 | 6分钟阅读 摘要 愿大家能够更好的开好站立会议,提升团队成员的协同,建造自己的巴别塔。 大家好,我是华为云的产品经理恒少。...一、开篇小故事 巴别塔,也叫通天塔;据《圣经·旧约·创世记》第11章记载:当时人类联合起来兴建希望能通往天堂的高塔,高塔越来越接近天堂,上帝紧张了,他看到人们这样齐心协力,统一强大,心想:如果人类真的修成宏伟的通天塔...为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,并让人类分散世界各地,最终巴别塔没有建成。...敏捷的众多实践中,有一个为了提升团队协作的经典实践:站立会议,本篇即介绍一下,融入华为的一些具体实践和“坑”和“雷”。...因为站在累,所以时间久了,就开不下去了,哈哈哈…… 愿大家能够更好的开好站立会议,提升团队成员的协同,建造自己的巴别塔:) 以上为今天的分享内容,谢谢大家!
本文为CDA原创文章,作者曾科,转载请注明来源 巴别塔的轰塌 圣经旧约第十一章,讲到了巴别塔的故事:人类联合起来兴建希望能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通...由此机器翻译由此陷入低潮,此时上帝笑了,你们永远别想再造巴别塔,那么机器翻译之路就这么被打断吗,人类的动力来自希望,可此时,希望变成了绝望… 基于规则的机器翻译-不尽如人意 到了上个世纪七十年代,计算机性能与全球化的发展使得机器翻译重回人们视野...在现成的翻译的句子中,有些词可以被翻译成多个词,有些则完全不需要翻译,这里一个句子中的每个词语便有各种翻译的概率,并且还有相对于平行文本句子中的位置的概率,于是这些都成了统计学意义上的参数,机器本身并不需要知道词的含义...此时,上帝打了个喷嚏,额,我没事,这个貌似有点靠谱,但是你们还是造不出巴别塔。 再造巴别塔-任重道远 虽然统计机器翻译表现出色,但是机器翻译本身还很多问题,机器取代不了人类。...也就是说,机器翻译最终还是受制于人类对语言本身的了解,它到底是怎么产生的,大脑中是如何运行的......路漫漫其修远兮啊,但还是要有信心,总有一日人类能够重塑圣经,再造巴别塔!
圣经旧约中记载,人类修建通往天堂的巴别塔。 为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通。...做业务就像是修巴别塔,不同的工种会说不同的语言: 产品的语言是原型图、各种AB test的数据 开发的语言是 Java、JS、SQL等 测试的语言是各种用例 这些语言都是对业务的描述,但是这些工种互相之间听不懂对方的语言...如果你能听懂不同工种的语言,将他们团结起来,当巴别塔建成之时,你就是最大的功臣。 这一切的前提,就是「懂业务」。 那有同学会说:工作这么忙,我哪有经历去了解别的工种啊?
由于上帝在这座城改变了人类的语言,将人们打散,因此这座城被称为「巴别」(混乱的意思),虽然这个故事不可考,但这座半途而废的巴别塔如今正静静地躺在伊拉克巴格达南部的平原上。...但是在世界上仍然有这样一群人,似乎被遗忘在巴别塔的角落:他们看起来与常人无异,但是在他们的世界里则是一片宁静:没有世界的喧嚣,同时也切断了与其他人正常沟通的渠道。 ?...但是这一套独特的语言体系相当于将这一特殊的群体局限在自己的圈子里:他们相互之间可以交流沟通,但是与健听人之间在无形中就被自然分隔在了巴别塔下。...帮助TA们重建「巴别塔」 随着越来越多年轻的听障人士受教育程度不断提升,有不少人已经可以通过文字来从外界传达以及获取信息,但是对于更多的听障人士,比如中老年以及内陆地区的听障人士,看懂文字仍然是一件十分困难的事情...举个简单的例子,在手语体系中每个词汇都有对应的手势,但是前后不同手势的变换,如何能够如真人一样流畅连贯,对于技术团队而言就是一项不小的挑战。
《圣经》里有一个故事说巴比伦人想建造一座塔直通天堂。建塔的人都说着同一种语言,心意相通、齐心协力。上帝看到人类竟然敢做这种事情,就让他们的语言变得不一样。...因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢?机器翻译被视为“重建巴别塔”的伟大创举。...二、自然语言处理的主要困难 自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。...而正确的消歧需要大量的知识,包括语言学知识(如词法、句法、语义、上下文等)和世界知识(与语言无关)。这带来自然语言处理的两个主要困难。
博主分享了图像的生成方式,在模型中输入需要呈现的材质照片,Depth2Image就会生成该材质对应的中文汉字。 此贴一出便引来广泛讨论。...在学习了1万个日文汉字后,Stable Diffusion模型开始为新事物创造「假汉字」,如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。 在这些字中,我们也发现了华点。...巴别塔后,人类文字不通,无法交流;现代科技在克服语言壁垒的同时,又在建造一座新的「巴别塔」。这次,人类会成功吗?
道格拉斯·亚当斯(Douglas Adams)在小说《银河系漫游指南》(《The Hitchhiker’s Guide to the Galaxy》)里畅想了一种叫巴别鱼(Babelfish)的神奇生物...人们携带巴别鱼后,就能够在它的帮助下听懂任何异国语言。巴别鱼的名字来源于《圣经》里著名的故事“巴别塔”:人类想上天堂,开始建造叫做巴别塔的通天巨塔。上帝为阻止人类登天,迫使人类说不同的语言。...由于沟通不畅,巴别塔计划最终半途而废。 那么是否可以将一种语言的语音直接转换为另外一种语言的文字呢? 这就是语音翻译需要解决的问题。...众所周知的是,一个可商用的中、英语音识别系统需要使用上万小时音频-转写平行数据训练得到,而一个商用的中到英文本机器翻译系统则需要上亿条平行句对训练得到。...而在端到端技术中,目标语言的翻译文本序列无法与源语言的转写文本序列建立直接的条件依赖关系,如图1 中。
介绍深度学习技术的书,介绍各种深度学习框架的书,但似乎还没有一本书,系统地介绍如何入门NLP科研,如何了解NLP学术圈概貌,如何阅读文献,如何选题,如何设计实验,如何写论文,如何做报告,如何选方向,如何在本科做好科研训练...《圣经》里有一个故事说巴比伦人想建造一座塔直通天堂。建塔的人都说着同一种语言,心意相通、齐心协力。上帝看到人类竟然敢做这种事情,就让他们的语言变得不一样。...因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢?机器翻译被视为“重建巴别塔”的伟大创举。...自然语言处理的主要困难 ---- 自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。
好文推荐 今日推荐《React 拖拽组件 Drag & Drop》 这篇文章介绍了React 提供了多种方式来实现拖拽功能,包括原生的 HTML5 Drag and Drop API 和第三方库如 react-dnd...从浅入深地介绍如何在 React 中实现拖拽功能,并通过代码示例来说明常见问题、易错点及如何避免。...Nuxt.js简介及其在服务端渲染中的重要性 Nuxt.js是一个基于Vue.js的通用应用框架,旨在简化服务端渲染和静态站点生成的开发流程。...实施服务端渲染的挑战 尽管Nuxt.js在服务端渲染方面具有诸多优势,但在实际应用中仍然面临一些挑战: 开发复杂度增加 服务端渲染涉及到服务器和客户端的交互,开发过程中需要考虑更多的细节。...例如,如何在服务器端和客户端之间共享状态、如何处理异步数据请求等。这些问题增加了开发的复杂度,对开发者的技术水平提出了更高的要求。
《圣经》里有一个故事说巴比伦人想建造一座塔直通天堂。建塔的人都说着同一种语言,心意相通、齐心协力。上帝看到人类竟然敢做这种事情,就让他们的语言变得不一样。...因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢?机器翻译被视为“重建巴别塔”的伟大创举。...自然语言处理的主要困难 自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。...而正确的消歧需要大量的知识,包括语言学知识(如词法、句法、语义、上下文等)和世界知识(与语言无关)。这带来自然语言处理的两个主要困难。
近期,一篇由ACL2021接收的论文或许可以带我们一窥巴别塔之后的世界。 据统计,目前世界上存在的语言超过6900种。 ?...《圣经·旧约·创世记》中记载着「巴别塔」的传说:人类联合起来兴建能通往天堂的高塔。 机器翻译的终极使命就是构建人工智能时代的「巴别塔」。 ?...同时,在最为极端的零样本(zero-shot)的场景下,简单应用LaSS能够大幅提升模型的表现,在30个测试的语言对中获得了平均8.3 BLEU、最高26.5 BLEU的提升。...(如英中、英法等)存在大量平行数据,对于小语种(如英-哈萨克),往往只有少量的甚至没有平行语料。...总结 为了解决多语言机器翻译中的语言冲突问题,论文提出了使用LaSS为每个语言对分配专属的子网络。 实验表明,LaSS能够显著缓解语言冲突问题。
《华盛顿邮报》在一篇社论中甚至建议,这一天应该只使用表情符号进行交流。 自1982年诞生以来,表情包已经步入“四十不惑”的阶段。...巴别塔、表情包与新的“世界语” 巴别塔,是《圣经》故事中的一座通天巨塔。在故事中,世上的人曾经共享一种语言,不受阻碍的交流使人类拥有无比强大的力量,也因此催生了建造一座通天巨塔的宏大想法。...“巴别塔”也因此成为语言间不可交流性的一种隐喻。 攻克这种不可交流性的实践,贯穿在漫长的人类历史中,并由此诞生了许多天才想法,例如世界语,即一种适用于全世界的通用语言。...表情包盛行的背后是图像时代的来临,如学者多丽丝·格雷伯所言:“我们一度推崇的借助文字符号传递的抽象意义,已经开始让位于建立在图像传播基础上的现实与感受”。...表情包与各个阶段的媒介形式联系紧密,在其发展历程中,各种技术手段被纳入,用于增强表情包的表现力以更好消弭“交流的无奈”。 这种交流的无奈,源于虚拟交流场域的身体缺失。
本文详细介绍了Nuxt.js中的运行时配置功能,包括定义和使用运行时配置的方法,以及如何通过useRuntimeConfig访问配置。...在 Nuxt.js 中,运行时配置是一个强大的功能,允许开发者根据不同的环境(如开发、生产等)动态地调整配置。...在 Nuxt.js 中,运行时配置是一个强大的功能,允许开发者根据不同的环境(如开发、生产等)动态地调整配置。一、什么是运行时配置?...在 Nuxt.js 中,你可以在 nuxt.config.ts 文件中定义运行时配置。...以下是如何在组件中使用它的示例: API Base URL: {{ config.public.apiBase }} </template
阿拉斯加巴罗的三个塔点:巴罗环境观测站 (BEO) 塔、南部生物复杂性实验 (BES) 塔以及气候监测和诊断实验室 (CMDL) 塔。...,包括巴罗环境观测站 (BEO) 塔、生物复杂性实验南塔 (BES) 以及气候监测和诊断实验室 (CMDL) 塔。...土壤温度剖面数据字典中的列显示了传感器和深度的通用列表。如第 5 节所述,各站点可能有不同数量的剖面、传感器和传感器深度。...另一种变化是在巴罗 BEO 和巴罗 BES 的高心和低心多边形中测量的 SWC,用 HCP 和 LCP 表示剖面位置(如 HCP_SWC_40,LCP_SWC_10)。...在数据文件的质量标志列中,填隙数据点的值为 1。 数据采集、材料和方法 地点描述 阿特卡苏克 阿特卡苏克站点位于巴罗以南 100 公里处。站点海拔为 25 米 ASL,仪器高度为两米。
这位女神级的神人,全名是洛夫莱斯伯爵夫人奥古斯塔·埃达·金·诺尔(Augusta AdaKing-Noel, Countess of Lovelace)。...在成为伯爵夫人之前,她原生家庭的姓氏更有名一些——拜伦(Byron) 别怀疑,Ada就是19世纪初期英国伟大的浪漫主义诗人乔治·戈登·拜伦(George Gordon Byron)的亲女儿。...得知巴贝奇的想法后,Ada马上被他的发明吸引住了并为其着迷。 事后她还给巴贝奇写信要来了差分机的图纸,决定一定要弄明白它的工作原理。...1834年,巴贝奇和Ada讨论,想设计一个比差分机更复杂的机器:分析机。 通过借鉴提花机,利用打孔卡片的控制,来实现各种复杂的操作,如公式计算、条件选择等。...在当时分析机的讨论中,Ada提出了用二进制数代替十进制数,数字和字母等符号可以编码成数据等编程概念。
之后不久,巴别塔的语言效应开始出现:每个NoSQL数据库都提供了自己独特的查询语言,这意味着需要学习更多的语言;将这些数据库连接到应用程序的难度增加,导致大量脆弱的粘合代码;缺乏第三方生态系统,要求公司开发自己的操作和可视化工具...巴别塔的故事:当时地上的人们都说同一种语言,当人们离开东方之后,他们来到了示拿之地。在那里,人们想方设法烧砖好让他们能够造出一座城和一座高耸入云的塔来传播自己的名声,以免他们分散到世界各地。...哲学: 从巴别塔的失败中汲取教训。 所有的细腰都是语言接口,而SQL更明显。 我们总是在拓宽细腰。 故事3:系统调用原语永存 这张地图,描绘了免费开源软件与微软帝国的史诗般的斗争。...在商业面前,Unix和Linux的似乎没有办法汲取巴别塔的教训。 操作系统的细腰在拓宽,但Unix的哲学却保留了下来。 作为细腰模型的案例经常被提及的,一个互联网协议栈,一个是Unix系统调用接口。...文件传输协议(FTP)和HTTP提供的服务在特定于应用程序的层中重叠。当HTTP因其自身的高层产品(如Web浏览器等应用程序)而变得更有价值时,FTP就消失了。
领取专属 10元无门槛券
手把手带您无忧上云