首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大话胡安: 我为什么创立协议实验室?

——[马可福音8:37,马太福音16:26] 大约是2007年,大学二年级的时候,我读到了伟大阿根廷作家博尔赫斯于1944年写的一篇著名的短篇小说:《巴别图书馆》。...但真正缺失的是这种获取BitTorrent内容的组合,使得这些数据集能够在全球范围内发布,并得到很好的版本控制。...带着这些思考,我在纸上写写画画,居然画出了下面的图形: 但巴别塔的前车之鉴让我重新思考博尔赫斯关于巴别图书馆的隐喻:协议。...巴别塔的故事:当时地球上的人们都说同一种语言,当人们离开东方之后,他们来到了示拿之地。在那里,人们想方设法烧砖好让他们能够造出一座城和一座高耸入云的塔来传播自己的名声,以免他们分散到世界各地。...从古腾堡到人类信息的全球基础设施,已经涌现了很多类似的破坏性技术,而协议实验室的工作,更接近博尔赫斯的巴别图书馆,其结果我们无法完全预测。

55210

新的AI上帝来了!有一天AI或取代一切旧宗教

Wells的短篇小说《蚂蚁帝国》改编的电影中的台词。...作为一个信仰犹太教的女性,我有时会想知道AI的兴起对世界宗教的意义何在。根据2012年皮尤研究《全球宗教景观》,全球84%的人有着宗教信仰。...或者,就像巴别塔的故事一样,AI的发展是否会造出一座足够高的塔以直达天堂,引发造物主制造出新的混乱和遗弃?...(译者注:巴别塔是《圣经》中记载,当时人类联合起来兴建希望能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。)...《圣经》中的巴别塔 我没有答案,但我确实希望如果AI真的变得超级聪明,它可以成为造福世界的有益力量,帮助我们变得更“神圣”而不是更弱小——或者至少更充满爱,不管我们是否信仰宗教。

74750
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    给外行能看懂的科普:这就叫自然语言处理

    因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢?机器翻译被视为“重建巴别塔”的伟大创举。...二、自然语言处理的主要困难 自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。...另外一个方面,消除歧义所需要的知识在获取、表达以及运用上存在困难。由于语言处理的复杂性,合适的语言处理方法和模型难以设计。 例如上下文知识的获取问题。...而经验主义方法则认为,从语言数据中获取语言统计知识,有效建立语言的统计模型。因此只要能够有足够多的用于统计的语言数据,就能够理解人类语言。

    1.4K70

    一个听不见的人,也想要看懂每一个新闻 | 搜狗发布全球首个手语AI合成主播

    由于上帝在这座城改变了人类的语言,将人们打散,因此这座城被称为「巴别」(混乱的意思),虽然这个故事不可考,但这座半途而废的巴别塔如今正静静地躺在伊拉克巴格达南部的平原上。...但是在世界上仍然有这样一群人,似乎被遗忘在巴别塔的角落:他们看起来与常人无异,但是在他们的世界里则是一片宁静:没有世界的喧嚣,同时也切断了与其他人正常沟通的渠道。 ?...但是这一套独特的语言体系相当于将这一特殊的群体局限在自己的圈子里:他们相互之间可以交流沟通,但是与健听人之间在无形中就被自然分隔在了巴别塔下。...帮助TA们重建「巴别塔」 随着越来越多年轻的听障人士受教育程度不断提升,有不少人已经可以通过文字来从外界传达以及获取信息,但是对于更多的听障人士,比如中老年以及内陆地区的听障人士,看懂文字仍然是一件十分困难的事情...举个简单的例子,在手语体系中每个词汇都有对应的手势,但是前后不同手势的变换,如何能够如真人一样流畅连贯,对于技术团队而言就是一项不小的挑战。

    69740

    回顾 babel 6和7,来预测下 babel 8

    babel 来自巴别塔的典故: 当时人类联合起来兴建希望能通往天堂的高塔,为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。...这座塔就是巴别塔。 这个巴别塔的典故很符合 babel 的转译器的定位。 ? babel 的编译流程 babel 从最初到现在一直的目的都很明确,就是把源码中的新语法和 api 转成目标浏览器支持的。...babel 中插件的应用顺序是:先 plugin 再 preset,plugin 从左到右,preset 从右到左,这样 plugin-transform-runtime 是在 preset-env 前面的...因为我最近在写 《babel 插件通关秘籍》 的小册,所以比较关注对插件的影响,我就问了一下 babel 维护者是不是需要在 @babel/core 调用插件的时候注入到 api 中,让插件可以拿到 targets...这样,不管是内置 plugin 和 preset 的实现方式也好,还是插件所能用的 api 也好,都完美支持了 targets,到了这个阶段 targets 才算真正融入进了 babel 中。

    79340

    刘知远:NLP研究入门之道(一)

    介绍深度学习技术的书,介绍各种深度学习框架的书,但似乎还没有一本书,系统地介绍如何入门NLP科研,如何了解NLP学术圈概貌,如何阅读文献,如何选题,如何设计实验,如何写论文,如何做报告,如何选方向,如何在本科做好科研训练...因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢?机器翻译被视为“重建巴别塔”的伟大创举。...自然语言处理的主要困难 ---- 自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。...而经验主义方法则认为,从语言数据中获取语言统计知识,有效建立语言的统计模型。因此只要能够有足够多的用于统计的语言数据,就能够理解人类语言。

    1.2K30

    一心二用:高性能端到端语音翻译模型同时识别声音和翻译

    道格拉斯·亚当斯(Douglas Adams)在小说《银河系漫游指南》(《The Hitchhiker’s Guide to the Galaxy》)里畅想了一种叫巴别鱼(Babelfish)的神奇生物...人们携带巴别鱼后,就能够在它的帮助下听懂任何异国语言。巴别鱼的名字来源于《圣经》里著名的故事“巴别塔”:人类想上天堂,开始建造叫做巴别塔的通天巨塔。上帝为阻止人类登天,迫使人类说不同的语言。...由于沟通不畅,巴别塔计划最终半途而废。 那么是否可以将一种语言的语音直接转换为另外一种语言的文字呢? 这就是语音翻译需要解决的问题。...而在端到端技术中,目标语言的翻译文本序列无法与源语言的转写文本序列建立直接的条件依赖关系,如图1 中。...表1 COSTT在Augmented Librispeech 英法上的实验性能 下面列举了COSTT在英法数据集上的样本测试结果(相应的音频文件可在附录中的项目地址获取):分析表明,COSTT在解决漏译

    1.9K40

    好文推荐 | 自然语言处理简介

    因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建塔。后来人们把这座塔叫作巴别塔,而“巴别”的意思就是“分歧”。...虽然巴别塔停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通的语言,重建巴别塔呢?机器翻译被视为“重建巴别塔”的伟大创举。...自然语言处理的主要困难 自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。...另外一个方面,消除歧义所需要的知识在获取、表达以及运用上存在困难。由于语言处理的复杂性,合适的语言处理方法和模型难以设计。 例如上下文知识的获取问题。...而经验主义方法则认为,从语言数据中获取语言统计知识,有效建立语言的统计模型。因此只要能够有足够多的用于统计的语言数据,就能够理解人类语言。

    1.2K20

    云原生时代,API 网关为何如此重要?

    这就是计算机世界中的“巴别塔”(Tower of Babel),因此只有解决了不同语言开发的系统以及不同存储方案带来的问题,才有机会构建足够复杂的产品。...而 API 的出现,则成功地解决了巴别塔问题,开发者只需要关心其他系统对外暴露的 API 即可,无需关心底层实现和细节。...因此,现在主流的 API 网关均采用插件来实现各种功能,比如在 Apache APISIX 中叫做 Plugins,在 Envoy 中则称之为 Filters,它们的含义是相同的。...由于数据面是直接对外提供服务的,如果被黑客入侵,就有机会获取到控制面的数据(比如 SSL 证书)和控制权,造成更大的破坏。...在 Kubernetes 的环境中,容器在不断的生成和销毁,弹性伸缩成为一个必选项而不是可选项。 想象一个场景:一家互联网电商公司做了一次促销,大量的用户在一个小时内涌入,促销结束后就会离开。

    69930

    表情包 40 年

    《华盛顿邮报》在一篇社论中甚至建议,这一天应该只使用表情符号进行交流。 自1982年诞生以来,表情包已经步入“四十不惑”的阶段。...巴别塔、表情包与新的“世界语” 巴别塔,是《圣经》故事中的一座通天巨塔。在故事中,世上的人曾经共享一种语言,不受阻碍的交流使人类拥有无比强大的力量,也因此催生了建造一座通天巨塔的宏大想法。...“巴别塔”也因此成为语言间不可交流性的一种隐喻。 攻克这种不可交流性的实践,贯穿在漫长的人类历史中,并由此诞生了许多天才想法,例如世界语,即一种适用于全世界的通用语言。...表情包盛行的背后是图像时代的来临,如学者多丽丝·格雷伯所言:“我们一度推崇的借助文字符号传递的抽象意义,已经开始让位于建立在图像传播基础上的现实与感受”。...表情包与各个阶段的媒介形式联系紧密,在其发展历程中,各种技术手段被纳入,用于增强表情包的表现力以更好消弭“交流的无奈”。 这种交流的无奈,源于虚拟交流场域的身体缺失。

    20710

    સુપ્રભાત!懂「印度方言」的多语言机翻模型挑战0资源翻译,论文已被ACL2021接收

    近期,一篇由ACL2021接收的论文或许可以带我们一窥巴别塔之后的世界。 据统计,目前世界上存在的语言超过6900种。 ?...《圣经·旧约·创世记》中记载着「巴别塔」的传说:人类联合起来兴建能通往天堂的高塔。 机器翻译的终极使命就是构建人工智能时代的「巴别塔」。 ?...同时,在最为极端的零样本(zero-shot)的场景下,简单应用LaSS能够大幅提升模型的表现,在30个测试的语言对中获得了平均8.3 BLEU、最高26.5 BLEU的提升。...(如英中、英法等)存在大量平行数据,对于小语种(如英-哈萨克),往往只有少量的甚至没有平行语料。...总结 为了解决多语言机器翻译中的语言冲突问题,论文提出了使用LaSS为每个语言对分配专属的子网络。 实验表明,LaSS能够显著缓解语言冲突问题。

    49830

    Meta用《圣经》训练超多语言模型:识别1107种、辨认4017种语言

    机器之心报道 编辑:Panda 在《圣经》中有一个巴别塔的故事,说是人类联合起来计划兴建一座高塔,希望能通往天堂,但神扰乱了人类的语言,计划也就因此失败。...到了今天,AI 技术有望拆除人类语言之间的藩篱,帮助人类造出文明的巴别塔。...接下来,使用之前已有的数据集(如 FLEURS 和 CommonVoice)和新数据集,Meta 的研究者还训练了一个语言辨识(LID)模型,并在 FLEURS LID 任务上进行了评估。...研究者在博客中设想:也许技术能鼓励人们留存自己的语言,因为有了好的技术后,他们完全可以使用自己喜欢的语言来获取信息和使用技术。 他们相信 MMS 项目是朝这个方向迈出的重要一步。

    35330

    basler相机sdk开发例子说明——c++

    Grab 这个例子演示了如何抓取过程中采用cinstantcamera类图像。...图像是抓住和异步处理,当应用程序处理一个缓冲区,缓冲区的下一个收购是平行进行的,cinstantcamera类使用一个缓冲池,从摄像头获取图像数据。...Grab_ChunkImage Basler相机提供块特征:相机可以生成每个图像的某些信息,如帧计数器,时间戳,和CRC校验,这是附加到图像数据的“块”。...Grab_MultiCast.cpp 此示例演示如何在多播模式下打开照相机.以及如何接收多播流。...名称和参数节点类型可以在巴斯勒塔程序员指南和API参考,在相机的用户手册,相机中的文件登记的结构和访问方法(如果适用),并利用塔查看器工具 x y offsetheight width ParametrizeCamera_LoadAndSave

    4.2K41

    真女神!世界上第一位程序员

    这位女神级的神人,全名是洛夫莱斯伯爵夫人奥古斯塔·埃达·金·诺尔(Augusta AdaKing-Noel, Countess of Lovelace)。...在成为伯爵夫人之前,她原生家庭的姓氏更有名一些——拜伦(Byron) 别怀疑,Ada就是19世纪初期英国伟大的浪漫主义诗人乔治·戈登·拜伦(George Gordon Byron)的亲女儿。...得知巴贝奇的想法后,Ada马上被他的发明吸引住了并为其着迷。 事后她还给巴贝奇写信要来了差分机的图纸,决定一定要弄明白它的工作原理。...1834年,巴贝奇和Ada讨论,想设计一个比差分机更复杂的机器:分析机。 通过借鉴提花机,利用打孔卡片的控制,来实现各种复杂的操作,如公式计算、条件选择等。...在当时分析机的讨论中,Ada提出了用二进制数代替十进制数,数字和字母等符号可以编码成数据等编程概念。

    1.3K40

    腾讯信息安全部征战世界机器翻译大赛获不俗战绩

    北京时间5月22日下午4点,在刚结束的世界机器翻译大赛(WMT)中,信安代表队(由信息安全部北京基础研究组bojiehu(胡博杰)、ambyera(阿敏巴雅尔)、springhuang(黄申)三人组成)...其中中英和英中的角逐非常激烈。...目前,英汉双向同声传译在业界已经并不鲜见,由于语料的丰富和容易获取(甚至购买),很多难题都被攻破。...如今,系统已上线并应用在多个业务场景中。...如演示视频: 维吾尔语-汉语同声传译系统 (确保清晰度,建议全屏播放) 同时,信息安全部希望通过在这个领域的多年积累和打磨,旨在打通藏语,蒙语,朝鲜语等小语种到汉语的巴别塔。

    2.1K50

    【愚公系列】《AI智能化办公:ChatGPT使用方法与技巧从入门到精通》 026-ChatGPT 的设计应用(建筑设计)

    通过结合 ChatGPT 和 Midjourey,设计师可以从AI模型中获取建筑设计方面的灵感和建议,帮助他们在设计过程中做出更具创意和独特性的作品。...设计师可以利用 ChatGPT 与其对话,提出关于建筑设计的问题或想法,从中获取建议和灵感。...(Vladimir Tatlin)** - 塔特林塔 (Tatlin's Tower) - **伊利亚·哥伦 (Ilya Golosov)** - Zuev Workers' Club ### 4....请着重考虑如何在设计中融入连续的动态曲线,使建筑看起来仿佛在空间中流动。建筑的外观应以光滑的白色和灰色调为主,通过大面积的曲面玻璃窗实现室内外的自然过渡。...请特别注意如何利用自然光,以及如何在居住空间中创造流畅的视觉和动线体验。"

    12120

    “细腰”战事:技术架构的进化

    之后不久,巴别塔的语言效应开始出现:每个NoSQL数据库都提供了自己独特的查询语言,这意味着需要学习更多的语言;将这些数据库连接到应用程序的难度增加,导致大量脆弱的粘合代码;缺乏第三方生态系统,要求公司开发自己的操作和可视化工具...巴别塔的故事:当时地上的人们都说同一种语言,当人们离开东方之后,他们来到了示拿之地。在那里,人们想方设法烧砖好让他们能够造出一座城和一座高耸入云的塔来传播自己的名声,以免他们分散到世界各地。...哲学: 从巴别塔的失败中汲取教训。 所有的细腰都是语言接口,而SQL更明显。 我们总是在拓宽细腰。 故事3:系统调用原语永存 这张地图,描绘了免费开源软件与微软帝国的史诗般的斗争。...在商业面前,Unix和Linux的似乎没有办法汲取巴别塔的教训。 操作系统的细腰在拓宽,但Unix的哲学却保留了下来。 作为细腰模型的案例经常被提及的,一个互联网协议栈,一个是Unix系统调用接口。...文件传输协议(FTP)和HTTP提供的服务在特定于应用程序的层中重叠。当HTTP因其自身的高层产品(如Web浏览器等应用程序)而变得更有价值时,FTP就消失了。

    49910

    【重磅】谷歌发布 Zero-Shot 神经机器翻译系统:AI 巴别塔有望成真(附论文)

    这意味着传说中的“巴别塔”有望成真。...假设我们使用日语和英语以及韩语和英语之间相互翻译为例,训练一个多语言系统,如动画中蓝色实线所示。...我们将其称为“零数据”(zero-shot)翻译,如动画中的黄色虚线所示。据我们所知,这还是首次将这种类型的迁移学习应用机器翻译中。...要每一步生成一个翻译好的英语单词,解码器需要注意被编码中文向量的加权分布中,与生成英语单词关系最为密切的那个(上图中解码器 d 上面多条透明蓝线中颜色最深的那条),解码器关注越多,蓝色越深。...有评论称,这可以说是实现“巴别塔”的第一步。

    1.7K70

    前端国际化:懒人必备的自动翻译

    国际化规范:许多国际化和本地化的标准和规范,如i18n,都是基于英语的,这意味着从英语翻译到其他语言的过程可以更好地遵循这些规范。...不过对于中小型项目,会有中杀鸡用牛刀的感觉。 使用 i18n ally 插件 上一篇文章中,我们简单介绍了 i18n-ally 这个神器。它的能力远远不止这些, 现在我们继续挖掘它的能力。...硬编码自动识别和提取 ally 插件支持识别文件中的硬编码字符串,并支持一键提取。...这个很方便,ally 插件会自动更新语言包和相对应的源代码 Review 系统 ally 插件也内置了建议的翻译 Review 工作流: 这种方式简易、精妙。...---- bbt 巴别塔 为了更高效地翻译和生成语言包,我们也开发了一个工具 —— bbt。这是一个自动化管理和翻译语言包的命令行工具。

    1.4K40
    领券