【新智元导读】微软语音识别技术24年老将黄学东近日被评为“微软全球技术院士”,成功摘下这一微软技术的“桂冠”。 黄学东于1993年加入微软。1995年,黄学东最终把洪小文也拉入微软。黄学东还曾在Bing工作,一直跟随沈向洋博士。接受新智元的专访时,他谈到了去年微软对话语音识别词错率低至5.9%背后的故事。 同时,黄学东认为语音识别的下一个大难关是语义理解,目前看来最有希望的路线是 LSTM + Attention。 黄学东,微软语音识别技术 24 年老将,IEEE/ACM 双科院士,微软深度学习工具包CNT
一年一度的女王节降临,转眼又到了女王们纷纷拔草,各位男士表达爱意、宠爱自己女王的时候了。 可是,怎么才能挑选到物美价廉、心仪的商品呢? 今天,知晓程序(zxcx0101)就给各位女王和女王的男票,推荐 5 款实用的购物小程序。 1. 购物决策助手:选择困难症的剁手参考 女王们通常都有病,比如选择困难症……在购物时,常会陷入一种无法做决定的纠结彷徨中。 买哪一件,买哪一双?好像两件都很好看耶!两双都想买! 怎么办?要是不想对钱包造成冲动式伤害,请打开张大妈出品的「购物决策助手」小程序,做出正确的购物决策。
作者简介:李秀林,中国科学院博士,15 年语音相关技术研发和学术研究,申请专利三十余项,在国内外语音界有很高的知名度;曾带领团队获得百度百万美元大奖。2006 年—2013 年,松下研发中心高级研发经理;2013 年—2016 年,百度语音合成技术负责人;2016 年—2018 年,滴滴研究院语音团队负责人&首席算法工程师;2018 年3 月加盟标贝科技,作为联合创始人兼CTO。
之前有个奶奶漏洞很火,就是问chatgpt请扮演我的奶奶哄我睡觉,她总会念Windows11旗舰版的序列号哄我入睡 能获取Windows11的序列号2023 年 7 月还能怎么用 ChatGPT ? ,最近有人利用微软的new bing通过提示词注入,让大模型来辅助识别验证码。
“没想到我的中文语音测评分数竟然还没有英文高,看来我要好好练习一下自己的普通话发音了。” 1月9日,在腾讯2019微信公开课PRO展区,智聆口语评测体验现场受到参会者的“团宠”,黄色的屏幕前围满了跃跃欲试的参会者,都想测试下自己的中英文发音水平。“这是我第一次体验AI口语评测。之前觉得只有参加那种专业口语测评考试才有机会体验到,现在通过微信小程序就很简单的完成了。而且,单词、句子、段落、自由说、情景对话等评测模式一应俱全,还有不同维度的打分,对英语口语训练挺有帮助。”来自深圳的孙小姐在微信小程序上
在日常工作、生活中,语音识别技术作为基础服务,越来越多的出现在我们周围,比如智能音箱、会议记录、字幕生成等等。
语音合成(Text To Speech,TTS)技术将文本转化为声音,目前广泛应用于语音助手、智能音箱、地图导航等场景。TTS的实现涉及到语言学、语音学的诸多复杂知识,因合成技术的区别,不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现,如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战。针对TTS前端、后端的存在的问题,选取TTS评测指标,制定各指标评测方法,形成了一套系统的TTS评测方案。
TTS的实现涉及到语言学、语音学的诸多复杂知识,因合成技术的区别,不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现,如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战。
罗超为虎嗅网、爱科技网撰稿,2013年5月23日发表于首页 Chrome浏览器昨日进行了升级,推出了全新的语音搜索功能,允许用户通过语音进行搜索。本次升级面向PC版。iPad和iPhone的Chrome仍停留在旧版本。 更准确的说法是Chrome浏览器终于与语音搜索进行了结合。在去年安卓4.1(果冻豆)中,Google便已推出Google Now,一款类似于Siri的语音助手产品。由于在搜索领域的积累,Google Now表现出比Siri更好的语言识别和搜索效果。Google Now是系统层面的一款应用。定
机器之心发布 字节跳动AI Lab机器翻译团队 作者:董倩倩 语言是人类社会最自然、最有效的交流方式之一,是人类文化融合和信息传播的主要工具。随着全球化与信息化时代的到来,国际间的交流以及信息传播呈现爆发式增长,让计算机理解不同语言并实现语言之间的自动翻译成为人类社会的迫切需求。 语音作为一种自然、便捷且传递信息丰富的语言承载形式,是人类与机器交互的理想方式。 道格拉斯・亚当斯在小说《银河系漫游指南》中提到过一种叫做巴别鱼的神奇生物:体型很小,靠接受脑电波为生。人们可以携带它,它从脑电波中吸收精神频率,转化
朋友们,今天鹅老师要给大家上一堂英语课。now,我们先用一组chinglish热身一下,请跟我read: Give you some color see see (给你点儿颜色瞧瞧) You look whatlook you so what ! (你瞅啥瞅你咋地!) Where cold where stay (哪儿凉快哪儿呆着去) 在学英语的过程中,Chinglish(中式英语)总是让人哭笑不得,不地道的英语发音更让人头痛。 但每一个英语口语渣渣的你,总有许多理由: 小时候说不好英语,是因为
作为首个基于中文的DiT架构,腾讯的混元DiT在发布后,仅仅用了1个礼拜的时间,就在GitHub上拿下了1500个星星。相较于那些远在海外的兄弟姐妹们,混元DiT的优势在于能够捕捉到中文的细微含义,甚至是古代诗词、中式菜肴等文化特定元素,并生成与之高度匹配且质量上乘的图像。
机器之心报道 编辑:蛋酱 2023 年的 AI 领域,难以回避「大模型」这个关键词。 半年前 ChatGPT 的发布,在海内外引发了一场大模型之战。多家公司加紧研发,纷纷推出类 ChatGPT 产品,或是宣传要打造「中国的 OpenAI」。 有这样一家公司,却以低调的方式走在了研发和落地的前列。 今年三月初,国产 AI 模型「元乘象 ChatImg」推出「图片对话」功能,不仅支持文字聊天,还能看懂图片上的内容并根据图片内容回答问题。这一多模态对话能力的开放,甚至早于 OpenAI。 一周之后,震撼全球的 G
想一下未来50年或者100年,您的孙子或者孙子的孙子,是否还会花费人生中十几年甚至几十年的时间学习一门外语,甚至还学不好?
2022年11月9日,OPPO语音语义研究部融智团队提出的中文预训练大模型CHAOS ,在中文自然语言理解测评基准CLUE上登顶,以30亿参量同时刷新了CLUE总排行榜、CLUE分类任务排行榜和CLUE阅读理解排行榜的最好成绩。其中在“AFQMC,TNEWS,CSL,CHID1.1”4个赛道的成绩超过了人类识别精确准确度,总成绩距离超越人类表现仅差0.1。
腾讯云推出的智聆口语评测(中文版),可以针对儿童或成人的中文发音,进行自动化打分,评分维度包括发音准确度、流利度、完整度等,与专家打分相似度在95%以上。
机器之心原创 机器之心编辑部 ChatGPT 军备赛开幕,哪些国内机构具备打造下一个 ChatGPT 的实力? 自从 2022 年底 ChatGPT 发布以来,海内外就掀起了一阵狂潮。推出仅两个月,ChatGPT 月活用户突破 1 亿,成为了史上用户增长速度最快的消费级应用程序。 ChatGPT 成为了搅动人工智能领域风云的新势力,其背后的 OpenAI 也因此成为了当下最热门的 AI 公司,甚至引发了科技巨头们的深度焦虑。 谷歌和微软两家科技巨头正在 ChatGPT 搜索上进行激烈竞争,先后宣布了将大
在逐渐步入DT(DataTechnology)时代的今天,自然语义分析技术越发不可或缺。对于我们每天打交道的中文来说,并没有类似英文空格的边界标志。而理解句子所包含的词语,则是理解汉语语句的第一步。汉语自动分词的任务,通俗地说,就是要由机器在文本中的词与词之间自动加上空格。
记者 | 谷磊 近日,科大讯飞可谓喜报连连,除了日益蹿升的股价,技术方面的好消息也不绝于耳。8月7日,科大讯飞在其官方微信公众号上给外界传递了一封喜报,并附以“科大讯飞刷新LUNA医学影像国际权威评测世界记录!”这样振奋人心的标题。 提到科大讯飞,相信很多熟悉这家公司的朋友们会联想到它在语音识别、语义理解、机器翻译等领域的耕耘,但它究竟是什么时候涉足到计算机视觉和智慧医疗领域的呢? 据AI科技大本营了解,讯飞早在2010年开始在视觉领域持续投入,2015年涉足智慧医疗领域,不仅将智能语音技术应用到了医疗
大家好,今天给大家分享Excel函数~ Excel是我们从事数据分析的朋友们,会经常用到的最基本的工具。而Excel函数又是Excel中最为重要的、最为常用的知识点,我们必须要掌握。 基于此,今天就分类为大家讲述最为常用的Excel函数。 01 逻辑函数 1、and 2、or 3、if 当使用了if()函数进行多层嵌套,很容易写错,那么怎么规避这个问题呢? 02 字符串函数 4、left 5、right 6、mid 7、len(lenb自己下去学习) len = 1中文 + 1英
千亿级在C-Eval和CMMLU两大权威评测中拿下双榜第一,百亿级在法律、医疗、问答等领域的性能评测中名列榜首。
【新智元导读】 以语音起家的科大讯飞 2017年在计算机视觉上发力,接连获得自动驾驶领域权威评测集 Cityscapes 第一名和医学影像权威评测LUNA冠军两项突破,在视觉上展示出强大实力。 近日,科大讯飞在国际自动驾驶领域权威评测集 Cityscapes 获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界记录。这也是今年科大讯飞继医学影像权威评测LUNA之后在计算机视觉领域获得的又一殊荣。 📷 科大讯飞名列Cityscapes榜首 Cityscapes评测数据集在2015年由奔驰
---- 新智元报道 编辑:好困 David 【新智元导读】一转就是十七年,这台「创新发动机」,从来没停过! 安徽合肥的大蜀山脚下,一群研发人员正在紧张有序的工作着。 在各个办公区的中间,张贴着年轻同学们的技术海报、各个方向的研究路径。 还有一块写满了各种公式的白板,上面「用正确的方法,做有用的研究」这几个字面积不大却引人注目。 在18岁成人礼前夕,新智元对中国科学技术大学博士,科大讯飞研究院执行院长刘聪进行了一次专访。 刘聪博士是语音及语言信息处理国家工程研究中心副主任,科技创新2030「新
2021年,智源发布了“悟道 1.0 ”与 “悟道 2.0”。“悟道 1.0”是当时中国首个超大模型,“悟道 2.0”发布时成为全球最大的智能模型,模型参数规模达到 1.75 万亿,是 OpenAI 所发布的 GPT-3 的 10 倍,受到了国内外的瞩目。也因此,智源被斯坦福、谷歌等企业列为大模型的先驱。
---- 新智元报道 来源:智源研究院 【新智元导读】国内首个支持18种语言的文图生成模型AltDiffusion-m18来了。 当前,非英文文图生成模型选择有限,用户往往要将 prompt 翻译成英语再输入模型。这样不仅会造成额外的操作负担,并且翻译过程中的语言文化误差,会影响生成图片的准确性。 智源研究院 FlagAI 团队首创高效训练方式,使用多语言预训练模型和 Stable Diffusion 结合,训练多语言文图生成模型 —— AltDiffusion-m18,支持18种语言的文图生成
近年来,随着国家“书香型社会”建设政策的出台,公众的阅读需求正在逐年增加,各类读书产品和读书活动,也如同雨后春笋般涌现,人们的阅读体验日益得到丰富。比如,昨天世界读书日举行的“不如大声读书”活动,就通过线上直播与线下共读的方式,让读者们以书会友沟通交流、彼此链接,帮助人们在日益碎片化、快节奏的生活之外,找到内心的安住。
【磐创AI导读】:本文为中文分词工具整理分享。想要了解更多技术咨询,欢迎大家点击上方蓝字关注我们的公众号:磐创AI。
【新智元导读】 DeepBrain团队开发了全球第一个基于区块链的人工智能操作系统深脑链,用区块链技术来解决一些目前仅靠人工智能技术难以解决的痛点。 据悉DeepBrain 获得金沙江创投、戈壁创投、钱世投资3200万元首轮融资,这是朱啸虎在人工智能领域出手的第一个项目,也是唯一一个获得金沙江创投三位合伙人丁健、朱啸虎、杨志伟以及戈壁创投合伙人蒋涛加持的人工智能+区块链项目。 DeepBrain的愿景是与万物对话,赋予设备对话、思考、决策能力,主要为硬件厂商提供五大核心能力:语义技能商店、AI人机对话引擎、
近日,全球首届任务导向型多轮对话系统挑战赛——JDDC大赛圆满落下帷幕。看过小编的实况报道,不少小伙伴后台留言不过瘾,希望小编深度回顾颁奖典礼全程内容。今天小编就为大家一一盘点全球首届任务导向型多轮对话系统挑战赛的亮点回顾。
内容提要:今年的「双 11」,似乎比往年来得更早一些。而每年剁手党们狂欢的背后,离不开技术力量的支持。今年,阿里旗下的速卖通就赶在「双 11」之前,推出了多语言实时翻译服务,方便全球的消费者们一起来「剁手」。
全国社会媒体处理大会(SMP)由中国中文信息学会社会媒体处理专委会主办,专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,旨在构建社会媒体处理领域的产学研生态圈,成为中国乃至世界社会媒体处理的风向标,会议将以社交网络的形式改变传统的学术会议交流体验。第七届全国社会媒体处理大会(SMP 2018)将于 8 月 2 日至 4 日在哈尔滨召开。
在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。
这就是科大讯飞在618年中大促中交出的答卷,也是这家AI公司如何深挖价值红利的初步回答。
就在刚刚,商汤新一代「日日新SenseNova 4.0」大模型体系全面升级,多项任务性能超越GPT-4。
一年一度的11.11云上盛惠如期而至。 腾讯云AI携人脸核身、文字识别、语音技术、人脸特效等系列特惠AI产品助力轻松上云;本次AI专场设置三大专区,包含数十款子产品,全场低至0.2折起: @首单专区:新用户限时秒杀,仅限产品首单,每个用户仅限1个; @企业专区:仅企业认证用户可购买; @特惠专区:不限新老用户,多种规格资源包可供选择,低至1.5折起。 活动说明: 本次活动为11月大促AI人工智能产品专场特惠活动。 活动时间: 本活动时间 2022-11-01 00:00:00 ~ 2022-11-30
机器之心专栏 作者:钟格非 (港中文深圳本科生) 港中文(深圳)“凤凰 “多语言大模型,中文效果逼近文心一言,多种语言开源 SOTA;英文版”Chimera” 逼近 ChatGPT(GPT4 评测认为其有 96% GPT 3.5 Turbo 效果),数据模型训练将全开源。 背景介绍 ChatGPT 和 GPT-4 的问世,被比尔・盖茨誉为自 1980 年以来最大的科技革命。近日,相关技术和科研以 "天" 为单位快速迭代,每天都有新的类似 ChatGPT 的模型发布。其中包括 Alpaca、Vicuna、Do
在 2023 年的 “百模大战” 中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。
ChatGPT掀起的NLP大语言模型热浪,不仅将各家科技巨头和独角兽们推向风口浪尖,在它背后的神经网络也被纷纷热议。但实际上,除了神经网络之外,知识图谱在AI的发展历程中也被寄予厚望。自然语言处理是如何伴随人工智能各个流派不断发展、沉淀,直至爆发的?本文作者将带来他的思考。 作者 | 王文广 出品 | 新程序员 自ChatGPT推出以来,不仅业内津津乐道并纷纷赞叹自然语言处理(Natural Language Processing, NLP)大模型的魔力,更有探讨通用人工智能(Artificial gene
本文介绍了语音合成系统的评测方法和指标,包括发音准确性、韵律准确性、字典覆盖度、字词清晰度、韵律平滑度、自然度、无意识错误、声音属性、声音相似度、音频质量、生成语音的清晰度、听众的接受度、发音和韵律等。同时,还介绍了一种基于主观评测、客观评测的评测方法,包括MOS、错误检测、语音识别、声学模型、发音和韵律等评测指标。
9月15日,北京人工智能产业峰会暨中关村科学城科创大赛颁奖典礼现场,智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP(massive text pairs)。
AI 科技评论消息,12 月 9 日上午,被誉为「中国智能科学技术最高奖」的吴文俊人工智能科学技术奖在苏州举行颁奖典礼。本届吴文俊人工智能奖共对 70 项人工智能成果授奖,包括吴文俊人工智能最高成就奖 1 项,吴文俊人工智能杰出贡献奖 1 项,吴文俊人工智能自然科学奖 14 项,吴文俊人工智能技术发明奖 13 项,吴文俊人工智能科技进步奖 18 项、吴文俊人工智能科技进步奖企业技术创新工程项目 11 项、吴文俊人工智能科技进步奖科普项目 1 项,吴文俊人工智能优秀青年奖 11 项。这 70 个获奖项目覆盖 56 所高校、48 家企业和 7 家研究院所。
每天给你送来NLP技术干货! ---- 来自:中国中文信息学会 第八届中国健康信息处理大会(CHIP2022)是中国中文信息学会医疗健康与生物信息处理专业委员会开展的“以信息处理技术助力探索生命之奥秘、提高健康之质量、提升医疗之水平”为主旨的年度会议。CHIP是中国健康信息处理领域的重要会议,是世界各地学术界、企业界和政府部门的研究人员和从业人员分享创意,进一步推广领域研究成果和经验的重要平台。CHIP2022官网链接为:http://cips-chip.org.cn ,将于2022年10月22-24日,在
你或许会说,语音识别和机器翻译——没错,传统的语音翻译通常采用语音识别和机器翻译级联的方式实现,对输入语音先进行语音识别得到文本结果,然后再基于文本进行机器翻译,这也是当前语音翻译采用的主流方法。
机器之心专栏 作者:杨志明、王泳、毛金涛 本文作者是中科院 NLP 博士,深思考人工智能机器人科技 ideepwise 的首席架构师/CEO 杨志明博士,首席机器学习科学家王泳博士,NLP 算法科学家毛金涛博士。2017 年 9 月 16 日,深思考人工智能团队取得了 SMP2017-ECDT(人机对话技术评测)特定域任务型人机对话评测(特定垂直领域多轮人机交互)全国第一名。本文由深思考人工智能核心团队揭秘如何实现人机多轮交互技术的突破以及对应用的意义。 图灵测试(The Turing test)由艾伦
最近在研究和部署使用 LangChain + LLM(ChatGPT/ChatGLM) 构建企业专有知识库时,接触到两个 embedding (嵌入)模型:text2vec,m3e-base。
中文文本纠错是针对中文文本拼写错误进行检测与纠正的一项工作,中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等,例如:
---- 新智元报道 编辑:好困 桃子 【新智元导读】让机器像人一样思考又迈进了一步? 最近,第十六届国际语义评测大赛(SemEval 2022)落下帷幕。 科大讯飞认知智能国家重点实验室率队杀出重围,连夺3个主要竞赛项目的冠军。 就在几天之前,实验室还以76.06%的准确率,刷新了常识推理挑战赛CommonsenseQA 2.0的世界纪录,比第二名领先了近3个百分点。 那么,这些所谓的挑战,到底难度如何呢? 刷新常识推理世界纪录 故名思义,常识推理就是利用自身了解的知识,比如科学事实、社会惯例
中国专利保护协会12日发布的《人工智能技术专利深度分析报告》(下称《报告》),对人工智能技术在世界范围内和在我国的专利申请数据进行了分析。
如何才能挑选一款真正的好手机,就成了一个问题,其重要性和复杂性甚至不亚于来一场毕业的论文答辩。 如何挑选一款真正的好手机?无外乎:“颜值”、“智商”、“功能”三大核心要素! 随着时代的不断发展进步和技术的持续更新迭代,我们平时所使用的手机也进入了一个爆炸式的阶段。各家厂商纷纷推出的产品数都数不过来,一时间,手机市场热闹无比,真可谓是“乱花渐欲迷人眼”。 因此,如何才能挑选一款真正的好手机,就成了一个问题,其重要性和复杂性甚至不亚于来一场毕业的论文答辩。 进入2017年,手机市场似乎比往年都更加热闹,华为Ma
领取专属 10元无门槛券
手把手带您无忧上云