首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

CDA原创 | 机器翻译之路-再造

本文为CDA原创文章,作者曾科,转载请注明来源 轰塌 圣经旧约第十一章,讲到了故事:人类联合起来兴建希望能通往天堂高塔;为了阻止人类计划,上帝让人类说不同语言,使人类相互之间不能沟通...但是,1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”结论,全面否定了机器翻译可行性,并建议停止对机器翻译项目的资金支持,...由此机器翻译由此陷入低潮,此时上帝笑了,你们永远别想再造,那么机器翻译之路就这么被打断吗,人类动力来自希望,可此时,希望变成了绝望… 基于规则机器翻译-不尽如人意 到了上个世纪七十年代,计算机性能与全球化发展使得机器翻译重回人们视野...此时,上帝打了个喷嚏,额,我没事,这个貌似有点靠谱,但是你们还是造不出。 再造-任重道远 虽然统计机器翻译表现出色,但是机器翻译本身还很多问题,机器取代不了人类。...也就是说,机器翻译最终还是受制于人类对语言本身了解,它到底是怎么产生,大脑中是如何运行......路漫漫其修远兮啊,但还是要有信心,总有一日人类能够重塑圣经,再造

1K80

常用60类图表使用场景、制作工具推荐!

人口金字 人口金字 (Population Pyramid) 也称为「年龄性别金字」,是彼此背靠背一对直方图,显示所有年龄组和男女人口分布情况。...人口金字最适合用来检测人口模式变化或差异。多个人口金字放在一起更可用于比较各国或不同群体之间的人口模式。 推荐制作工具有:AnyChart、D3 (重叠版本)、Vega、ZingChart。...图表其中一条轴代表要比较具体类别,另一条则用作离散数值标尺。 条形图离散数据是分类数据,针对是单一类数量多少,而不会显示数值在某时间段内持续发展。...流向地图 流向地图 (Flow Map) 在地图上显示信息或物体从一个位置到另一个位置移动及其数量,通常用来显示人物、动物和产品迁移数据。...甘特图适合用来规划和估计整个项目的所需时间,也可显示相互重迭活动。

8.7K20
您找到你想要的搜索结果了吗?
是的
没有找到

干货 | 元旦,一起NLP!(上)

第一部分 | NLP诞生史 《圣经》关于故事 1.从前,巴比伦人想建造一座直通天堂。 建的人都说着同一种语言,心意相通、齐心协力。上帝看到人类竟然敢做这种事情,就让他们语言变得不一样。...因为人们听不懂对方在讲什么,于是大家整天吵吵闹闹,无法继续建。后来人们把这座叫作,而“意思就是“分歧”。...2.虽然停建了,但一个梦想却始终萦绕在人们心中:人类什么时候才能拥有相通语言,重建呢? 机器翻译被视为“重建伟大创举。...数据集任务是,给定前4句话组成一个小故事,在候选两句话中选出更合适作为当前故事结尾那句——所以是一个二分类任务。...并且因为这些故事是人为干预,所以保证在涵盖标准答案5句话中,不会有杂乱无关信息,所有信息都是为核心故事服务。来看一个例子: 这些好玩东西是怎么实现?机器真的可以代替川普发言吗?

90760

60 种常用可视化图表,该怎么用?

人口金字 人口金字 (Population Pyramid) 也称为「年龄性别金字」,是彼此背靠背一对直方图,显示所有年龄组和男女人口分布情况。...人口金字最适合用来检测人口模式变化或差异。多个人口金字放在一起更可用于比较各国或不同群体之间的人口模式。 推荐制作工具有:AnyChart、D3 (重叠版本)、Vega、ZingChart。...图表其中一条轴代表要比较具体类别,另一条则用作离散数值标尺。 条形图离散数据是分类数据,针对是单一类数量多少,而不会显示数值在某时间段内持续发展。...流向地图 流向地图 (Flow Map) 在地图上显示信息或物体从一个位置到另一个位置移动及其数量,通常用来显示人物、动物和产品迁移数据。...甘特图适合用来规划和估计整个项目的所需时间,也可显示相互重迭活动。

8.6K10

表情包 40 年

今时今日表情包,虽不再处于讨论中心,影响力却丝毫不减,它以一种隐秘方式,潜移默化地参与着人们虚拟交流。 、表情包与新“世界语” ,是《圣经》故事中一座通天巨。...在故事中,世上的人曾经共享一种语言,不受阻碍交流使人类拥有无比强大力量,也因此催生了建造一座通天巨宏大想法。...直到耶和华降临,“变乱他们口音,使他们言语彼此不通”,于是,不同人群使用差异化交流符号,无法再进行无阻碍交流。“”也因此成为语言间不可交流性一种隐喻。...可以说,表情包长达四十年发展史,也是一部互联网媒介发展史。由表情符号转向表情包、形态不断丰富过程,恰恰是技术介质不断发展过程。...2022年,Adobe调查了5000名表情符号用户,其中73%受访者认为,使用表情符号的人比不使用表情符号的人“更友好、更有趣、更酷”。

13810

可视化图表样式使用大全

人口金字 (Population Pyramid) 也称为「年龄性别金字」,是彼此背靠背一对直方图,显示所有年龄组和男女人口分布情况。 人口金字最适合用来检测人口模式变化或差异。...图表其中一条轴代表要比较具体类别,另一条则用作离散数值标尺。 条形图离散数据是分类数据,针对是单一类数量多少,而不会显示数值在某时间段内持续发展。...流向地图 (Flow Map) 在地图上显示信息或物体从一个位置到另一个位置移动及其数量,通常用来显示人物、动物和产品迁移数据。...甘特图 (Gantt Chart) 通常用作项目管理组织工具,显示活动(或任务)列表和持续时间,也显示每项活动何时开始和结束。 甘特图适合用来规划和估计整个项目的所需时间,也可显示相互重迭活动。...脑力激荡图经常在项目初期使用,用来产生想法、查找关联、分类想法、组织信息、显示结构和一般学习。 推荐制作工具有:Coggle、MindMup 记数符号图表 ?

9.3K10

「非广告」程序员如何才能不被裁?

那你学习方向能不能和「减少获客成本」或者「提高转化率」挂钩呢? 比如,别家都是放马车图片,你能不能做马车3D全景展示呢? 将你努力方向,尽可能与公司核心业务挂钩,你在公司位置就会稳固。...即使公司经营不善,你被裁了,你产出也能帮你很快找到新工作。 现在市面上很多程序员简历,都是「精通这个技术,熟练那个技术」。 但很少有会从「我对业务创造了什么价值角度」来谈技术。...圣经旧约中记载,人类修建通往天堂。 为了阻止人类计划,上帝让人类说不同语言,使人类相互之间不能沟通。...做业务就像是修,不同工种会说不同语言: 产品语言是原型图、各种AB test数据 开发语言是 Java、JS、SQL等 测试语言是各种用例 这些语言都是对业务描述,但是这些工种互相之间听不懂对方语言...产品与开发互相敌视,就能稳固领导地位。 如果你能听懂不同工种语言,将他们团结起来,当建成之时,你就是最大功臣。 这一切前提,就是「懂业务」。

60530

大话胡安: 我为什么创立协议实验室?

——[马可福音8:37,马太福音16:26] 大约是2007年,大学二年级时候,我读到了伟大阿根廷作家博尔赫斯于1944年写一篇著名短篇小说:《图书馆》。...为了传播和理解基督教教义,现代大学被广泛设立。为了人类未来,我决心构建人类知识和信息图书馆。 毕业之后,大概是2013年,我一直在研究一大堆知识工具。...我认为这里潜力没有被充分利用。 带着这些思考,我在纸上写写画画,居然画出了下面的图形: 但前车之鉴让我重新思考博尔赫斯关于图书馆隐喻:协议。...故事:当时地球上的人们都说同一种语言,当人们离开东方之后,他们来到了示拿之地。在那里,人们想方设法烧砖好让他们能够造出一座城和一座高耸入云来传播自己名声,以免他们分散到世界各地。...从古腾堡到人类信息全球基础设施,已经涌现了很多类似的破坏性技术,而协议实验室工作,更接近博尔赫斯图书馆,其结果我们无法完全预测。

53610

《自然语言处理实战入门》文本检索与信息抽取 ---- 关键词抽取

适合word2vec模型向量化数据。 (2)Jaccard(杰卡德)相似性系数,主要用于计算符号度量或布尔值度量样本间相似度。...若样本间特征属性由符号和布尔值标识,无法衡量差异具体值大小,只能获得“是否相同”这样一种结果,而Jaccard系数关心是样本间共同具有的特征。适合词集模型向量化数据。...(3)海灵格-恰亚(Hellinger-Bhattacharya)距离(HB距离),也称为海灵格距离或恰亚距离。恰亚距离有恰亚(A....总的来说,海灵格-恰亚距离是一个 f 散度(f-divergence),f 散度在概率论中定义为函数 Dƒ(P||D),可用于测量 P 和 Q 概率分布之间差异。...海灵格-恰亚距离数学定义为: 其中 hdb(u,v) 表示文档向量 u 和 v 之间海灵格-恰亚距离,并且它等于向量平方根差欧几里得或 L2 范数除以 2 平方根。

73620

华为敏捷DevOps实践:如何开好站立会议

阅读字数:2175 | 6分钟阅读 摘要 愿大家能够更好开好站立会议,提升团队成员协同,建造自己。 大家好,我是华为云产品经理恒少。...一、开篇小故事 ,也叫通天;据《圣经·旧约·创世记》第11章记载:当时人类联合起来兴建希望能通往天堂高塔,高塔越来越接近天堂,上帝紧张了,他看到人们这样齐心协力,统一强大,心想:如果人类真的修成宏伟通天...为了阻止人类计划,上帝让人类说不同语言,使人类相互之间不能沟通,并让人类分散世界各地,最终没有建成。...————以上摘自互联网:) 这个小宗教故事,揭示如果语言相通,目标一致产生巨大作用,都可以建成一个通天。 而软件开发过程却又是一个离不开协作、沟通过程。...因为站在累,所以时间久了,就开不下去了,哈哈哈…… 愿大家能够更好开好站立会议,提升团队成员协同,建造自己:) 以上为今天分享内容,谢谢大家!

85340

「非广告」程序员如何才能尽量避免被裁?

持续组织了近一年源码共读活动,感兴趣可以 点此扫码加我微信 ruochuan12 参与,每周大家一起学习200行左右源码,共同进步。...那你学习方向能不能和「减少获客成本」或者「提高转化率」挂钩呢? 比如,别家都是放马车图片,你能不能做马车3D全景展示呢? 将你努力方向,尽可能与公司核心业务挂钩,你在公司位置就会稳固。...圣经旧约中记载,人类修建通往天堂。 为了阻止人类计划,上帝让人类说不同语言,使人类相互之间不能沟通。...做业务就像是修,不同工种会说不同语言: 产品语言是原型图、各种AB test数据 开发语言是 Java、JS、SQL等 测试语言是各种用例 这些语言都是对业务描述,但是这些工种互相之间听不懂对方语言...产品与开发互相敌视,就能稳固领导地位。 如果你能听懂不同工种语言,将他们团结起来,当建成之时,你就是最大功臣。 这一切前提,就是「懂业务」。

44420

一心二用:高性能端到端语音翻译模型同时识别声音和翻译

道格拉斯·亚当斯(Douglas Adams)在小说《银河系漫游指南》(《The Hitchhiker’s Guide to the Galaxy》)里畅想了一种叫鱼(Babelfish)神奇生物...人们携带鱼后,就能够在它帮助下听懂任何异国语言。名字来源于《圣经》里著名故事“”:人类想上天堂,开始建造叫做通天巨。上帝为阻止人类登天,迫使人类说不同语言。...由于沟通不畅,计划最终半途而废。 那么是否可以将一种语言语音直接转换为另外一种语言文字呢? 这就是语音翻译需要解决问题。...表1 COSTT在Augmented Librispeech 英法上实验性能 下面列举了COSTT在英法数据集上样本测试结果(相应音频文件可在附录中项目地址获取):分析表明,COSTT在解决漏译...传送门 论文地址:https://arxiv.org/abs/2009.09737 代码地址:https://github.com/dqqcasia/st 项目地址:https://dqqcasia.github.io

1.7K40

AI上帝来了!有一天AI或取代一切旧宗教

Wells短篇小说《蚂蚁帝国》改编电影中台词。...这样来看,有形AI霸主想法仍超出了我们理解范围。 AI使宗教失效 最后,人工智能有可能促成无神论兴起和世界宗教最终解体。...AI是否能够完全证明或反驳神存在?或者,就像故事一样,AI发展是否会造出一座足够高以直达天堂,引发造物主制造出新混乱和遗弃?...(译者注:是《圣经》中记载,当时人类联合起来兴建希望能通往天堂高塔;为了阻止人类计划,上帝让人类说不同语言,使人类相互之间不能沟通,计划因此失败,人类自此各散东西。)...《圣经》中 我没有答案,但我确实希望如果AI真的变得超级聪明,它可以成为造福世界有益力量,帮助我们变得更“神圣”而不是更弱小——或者至少更充满爱,不管我们是否信仰宗教。

71750

托尔斯泰《安娜·卡列尼娜》主要人物

—温文尔雅 扎哈尔·尼基季奇——斯季瓦秘书 谢尔茨基一家: 谢尔茨基公爵 谢尔茨卡娅公爵夫人 (下面按照年龄顺序排列) 谢尔茨基——多莉和吉提,娜塔莉的哥哥——与列文一起温习功课并同时考进大学...卡瓦索夫——列文大学里老同学、自结婚后还未见过面的卡瓦索夫教授。卡瓦索夫以其明朗而又纯朴世界观赢得了列文好感。...卡瓦索夫,费奥多尔·瓦西里伊奇,早已打算履行对列文许下去他家造访诺言,于是乘车同他一起前往。...娜坚卡——利季娅·伊万诺夫娜侄女,是在她身边受教育 特西公爵夫人(彼得戈夫美人,特韦尔卡娅公爵夫人)——特西是安娜表嫂,与渥伦斯基同姓,她每年有十二万卢布收入。...安娜刚进入社交界,特西公爵夫人就特别喜欢她,处处照应她,把她拉进自己圈子里,同时嘲笑利季娅·伊万诺夫娜伯爵夫人那个社交圈。 图什克维奇——特西情人。

3.9K20

60种常用可视化图表使用场景——(下)

36、地区分布图 地区分布图通常用来显示不同区域与数据变量之间关系,并把所显示位置数值变化或模式进行可视化处理。...39、流向地图 流向地图 (Flow Map) 在地图上显示信息或物体从一个位置到另一个位置移动及其数量,通常用来显示人物、动物和产品迁移数据。...40、甘特图 甘特图 (Gantt Chart) 通常用作项目管理组织工具,显示活动(或任务)列表和持续时间,也显示每项活动何时开始和结束。...甘特图适合用来规划和估计整个项目的所需时间,也可显示相互重迭活动。...在绘制记数符号图表时,将类别、数值或间隔放置在同一个轴或列(通常为 Y 轴或左侧第一列)上。每当出现数值时,在相应列或行中添加记数符号

10110

真女神!世界上第一位程序员

这位女神级神人,全名是洛夫莱斯伯爵夫人奥古斯·埃达·金·诺尔(Augusta AdaKing-Noel, Countess of Lovelace)。...在成为伯爵夫人之前,她原生家庭姓氏更有名一些——拜伦(Byron) 怀疑,Ada就是19世纪初期英国伟大浪漫主义诗人乔治·戈登·拜伦(George Gordon Byron)亲女儿。...1833年6月5日,Ada参加了数学家查尔斯·贝奇在家举办聚会并和他成为了朋友。贝奇知道 Ada 母女都对数学很有研究后,还邀请她们参观他发明差分机。...事后她还给贝奇写信要来了差分机图纸,决定一定要弄明白它工作原理。 1834年,贝奇和Ada讨论,想设计一个比差分机更复杂机器:分析机。...通过借鉴提花机,利用打孔卡片控制,来实现各种复杂操作,如公式计算、条件选择等。 在当时分析机讨论中,Ada提出了用二进制数代替十进制数,数字和字母等符号可以编码成数据等编程概念。

1.2K40

你真的理解数码技术吗?(一)

然而,人类那些丰富多彩语言和文字,却让知识和信息传播受到了局限。圣经里有一个故事,说就是人类因为说着不同语言,导致无法在一起工作,从而停止了修建通往天堂伟大工程——。...(有意思是,现在最著名软件集成开发环境Eclipse,它多国语言翻译项目,名字就叫Babel“”),现代考古学家通过著名罗塞石碑,如下图1-1所示——一块以希腊文、古埃及象形文字、古埃及通俗文字刻下同一片文章...图1-2 结绳记事 我们可以注意到,绳结本身具备状态并不多,只有大小、数量、顺序、位置,甚至是颜色和绳结类型差别。...绳子上结,无疑也是这类符号中最古老一员,绳结大小、位置、打法,都代表着不同状态,从而宣称自己符号含义。...而关于“有序”概念,在人类语言中也占有重要位置,一切语言都有自己语序,虽然可能不会一直恒定,但是总体来说是有一定规律

72040

一个听不见的人,也想要看懂每一个新闻 | 搜狗发布全球首个手语AI合成主播

由于上帝在这座城改变了人类语言,将人们打散,因此这座城被称为「」(混乱意思),虽然这个故事不可考,但这座半途而废如今正静静地躺在伊拉克巴格达南部平原上。...但是在世界上仍然有这样一群人,似乎被遗忘在角落:他们看起来与常人无异,但是在他们世界里则是一片宁静:没有世界喧嚣,同时也切断了与其他人正常沟通渠道。 ?...但是这一套独特语言体系相当于将这一特殊群体局限在自己圈子里:他们相互之间可以交流沟通,但是与健听人之间在无形中就被自然分隔在了塔下。...帮助TA们重建「」 随着越来越多年轻听障人士受教育程度不断提升,有不少人已经可以通过文字来从外界传达以及获取信息,但是对于更多听障人士,比如中老年以及内陆地区听障人士,看懂文字仍然是一件十分困难事情...想要达到信、达、雅境界,仅靠技术手段显然不足以支撑,在这背后是对于语义语境深刻理解,以及在语言学上长年积累才能实现

65240

2015-2017 年阿拉斯加通量站点 CO2 和 CH4 通量及气象情况

阿拉斯加三个点:罗环境观测站 (BEO) 、南部生物复杂性实验 (BES) 以及气候监测和诊断实验室 (CMDL) 。...,包括罗环境观测站 (BEO) 、生物复杂性实验南 (BES) 以及气候监测和诊断实验室 (CMDL) 。...另一种变化是在罗 BEO 和罗 BES 高心和低心多边形中测量 SWC,用 HCP 和 LCP 表示剖面位置(如 HCP_SWC_40,LCP_SWC_10)。...伊沃图克 伊沃图克是最南端址,位于布鲁克斯山脉山麓 IVO 简易机场附近,罗以南约 300 公里,地处极地苔原。站点海拔为 579 米(ASL),仪器高度为 4 米。...)在所有站点 4 至 6 个位置测量 2 至 5 厘米深度土壤热通量。

6210

赛博仓颉,在线造字!Stable Diffusion:没人比我更懂汉字

在Reddit上,有一个「r/ChineseLanguage」的话题,里头专门发一些外国人学中文遇到问题吐槽。 对大部分学习中文外国人来说,汉字永远是个跨不过去坎。...例如,用火腿组成「肉」字, 以及用绳子组成「绳」字。 博主分享了图像生成方式,在模型中输入需要呈现材质照片,Depth2Image就会生成该材质对应中文汉字。 此贴一出便引来广泛讨论。...网友在热情分享自己创作文字同时,也激动地表示:这在教育领域应用未来可期! 其实在两年前,已经有人从事文字图像化研究。...可以发现,当时AI生成图像更属于艺术字范畴。例如右下角图像,小编看了好久才认出是「制」字。 经过两年发展,文字图像化技术更加成熟。...后,人类文字不通,无法交流;现代科技在克服语言壁垒同时,又在建造一座新」。这次,人类会成功吗?

1.1K50
领券