曾几何时,人们与手机、汽车交互的方式从选择指令变成了自然对话,这种方式让人们享受了方便,因为技术不断发展,AI 助手能为我们做的事情也越来越多。
美国东部时间12月1日,国际权威AI基准测试MLPerf™公布最新一期训练(Training)榜单V1.1。在全部16个固定任务(Closed Division)测试中,浪潮信息和英伟达包揽15个冠军。 在单机测试的8项任务中,浪潮信息获7项冠军,英伟达获1项冠军;在集群测试的8项任务中,英伟达获7项冠军,微软云获1项冠军。 谷歌、微软云、英伟达、浪潮信息、百度、戴尔等14家公司及科研机构,参与此次MLPerf™基准测试,共提交180项固定任务(Closed)成绩,6项开放任务(Open)成绩。固定任务要求
笔记软件领域可能是软件行业最为内卷的赛道。如果你问一个重度笔记用户,他便能脱口而出几十个笔记软件。即便对笔记软件不怎么关心的普通用户,也能知道 5 个左右的笔记软件。
英语作为教育改革的热点学科,近年来越发强调对学生听说运用能力的考核。随着“双减”政策的深入,英语听说教学面临着提升课堂教学质量、提高作业设计水平的新命题。 近日,腾讯教育旗下智慧英语听说教学解决方案——腾讯英语君亮相深圳市龙岗区初中英语教研会,只需通过一个软件一套答题器,就可以帮助学校搭建起英语听说互动课堂,助力解决英语听说教学训练不足、学生口语水平难提升的问题,为“双减”之下的英语听说教学提质增效带来了新思考。 一键搭建英语听说互动课堂 音素级口语评测实时纠错 “哑巴英语”是中国学生学习英语常见的现象
机器之心转载 公众号:Trio 如何评测语义领域相关技术是大家共同关注的。三角兽公司基于多年理论和相关技术实践的经验,针对语义领域的 4个方向技术,将会发表一系列解读文章。本篇文章由三角兽 CEO Z
“没想到我的中文语音测评分数竟然还没有英文高,看来我要好好练习一下自己的普通话发音了。” 1月9日,在腾讯2019微信公开课PRO展区,智聆口语评测体验现场受到参会者的“团宠”,黄色的屏幕前围满了跃跃欲试的参会者,都想测试下自己的中英文发音水平。“这是我第一次体验AI口语评测。之前觉得只有参加那种专业口语测评考试才有机会体验到,现在通过微信小程序就很简单的完成了。而且,单词、句子、段落、自由说、情景对话等评测模式一应俱全,还有不同维度的打分,对英语口语训练挺有帮助。”来自深圳的孙小姐在微信小程序上
小编新接触语音SDK项目,SDK无UI、底层调用多个C++算法库、提供的是AI服务。语音AI项目,识别效果是至关重要的一环,识别效果评测也是一项测试重点。为了制定一个专业、全面的效果评测的方案,小编学习了相关知识,对方案制定有了初步思路。希望对测试小伙伴有所帮助~~(●—●)
AI 科技评论按:2017 年 7 月 8 日,由中国计算机学会(CCF)主办,雷锋网与中国香港中文大学(深圳)承办的全球人工智能与机器人峰会(CCF-GAIR)进入第二天。在智能助手专场,来自哈尔滨工业大学的刘挺教授为我们带来了题为“人机对话技术的进展”的主题演讲。 📷 刘挺,哈尔滨工业大学教授,社会计算与信息检索研究中心主任。多次担任国家863重点项目总体组专家、973项目专家组成员、基金委会评专家,入选科技部中青年科技创新领军人才。主要研究方向为自然语言处理和社会计算,是国家973课题、国家
2022年11月9日,OPPO语音语义研究部融智团队提出的中文预训练大模型CHAOS ,在中文自然语言理解测评基准CLUE上登顶,以30亿参量同时刷新了CLUE总排行榜、CLUE分类任务排行榜和CLUE阅读理解排行榜的最好成绩。其中在“AFQMC,TNEWS,CSL,CHID1.1”4个赛道的成绩超过了人类识别精确准确度,总成绩距离超越人类表现仅差0.1。
记者 | 谷磊 近日,科大讯飞可谓喜报连连,除了日益蹿升的股价,技术方面的好消息也不绝于耳。8月7日,科大讯飞在其官方微信公众号上给外界传递了一封喜报,并附以“科大讯飞刷新LUNA医学影像国际权威评测世界记录!”这样振奋人心的标题。 提到科大讯飞,相信很多熟悉这家公司的朋友们会联想到它在语音识别、语义理解、机器翻译等领域的耕耘,但它究竟是什么时候涉足到计算机视觉和智慧医疗领域的呢? 据AI科技大本营了解,讯飞早在2010年开始在视觉领域持续投入,2015年涉足智慧医疗领域,不仅将智能语音技术应用到了医疗
AI 研习社按:人工智能当前正处于爆发阶段,语音交互作为人工智能的重要组成部分正在各行业全面的落地,在人机进行语音交互的过程中,机器需要通过耳朵实现听觉的作用。
1 月 8 日,哈工大社会计算与信息检索研究中心(HIT-SCIR)推出了一个“智能荐股”的公众号,通过对股市信息的智能分析,每天推荐若干只国内 A 股市场的股票,并给出每日收益情况以及一段时间内的累积收益情况的总结。 据官方介绍,智能股票推荐是基于哈工大 SCIR 开展的事件驱动的股票分析与预测技术,通过对国内 A 股市场的新闻事件信息和股票量价数据进行抽取与表示学习,利用深度学习模型完全自动化地给出股票未来走势的预测,进而推荐若干只潜力股。 哈工大 HIT-SCIR 2000 年 9 月 1 日,哈
日前,深圳市光明区光明小学六年级412名学生在英语听说模拟考试中,迎来了“AI”考官。考试任务一键下发、语音发音音素级诊断、学情报告即时生成……AI贯穿了整个英语听说考试实施流程。在提高考务管理人员工作效率和评分精准度的同时,帮助老师搭建了“教、考、评”的教学链路数据闭环。此次英语模拟考试由腾讯英语君听说考试系统提供技术支撑。 临近期末,为了让学生尽快适应英语听说考试的形式和内容,光明小学六年级举行了英语听说模拟考试。考试前,光明小学的老师借助系统提供的题型设计能力和题库资源,创建了听选图片、听选信息、模仿
---- 新智元报道 编辑:David 好困 【新智元导读】大热天的,别整天抱着单词本不放了,找个新朋友陪读陪聊陪作业,它不香么? 大家先来猜猜,这个「赛马场巨头」是什么? 没错,是「The Lord of the Rings」指环王。 显然,「赛马场巨头」主要是错误地理解了「Ring」的含义。其实,稍有常识的人都知道,Ring是指拳击台,所以「正确」的译名是:拳皇。(开个玩笑) 不过讲道理,你不太能苛求一个上世纪90年代的翻译。 但是在互联网发达的现在……烧烤「丈夫」就不太合适了吧。 以及,
根据OMDIA预测, 2020年全球智能家居市场价值将达到1210亿美元,到2024年预计将超过2490亿美元,复合年均增长率超过25%。
语音合成(Text To Speech,TTS)技术将文本转化为声音,目前广泛应用于语音助手、智能音箱、地图导航等场景。TTS的实现涉及到语言学、语音学的诸多复杂知识,因合成技术的区别,不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现,如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战。针对TTS前端、后端的存在的问题,选取TTS评测指标,制定各指标评测方法,形成了一套系统的TTS评测方案。
编者按:【双周动态】是【融智未来】推出的产业动态及投融资事件回顾栏目,主要盘点两周内产业大事件和创新企业投融资动态。
TTS的实现涉及到语言学、语音学的诸多复杂知识,因合成技术的区别,不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现,如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战。
今天办公室收到了 6 块 Apple Watch,小伙伴们很兴奋,玩得不亦乐乎,很久没有一款硬件产品能够让所有人都如此兴奋了。Apple 宝刀不老,Apple Watch 再一次呈现了苹果的魅力。一个
每天给你送来NLP技术干货! ---- 实验室窗外 上海人工智能实验室是我国人工智能领域新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。 实验室网址: www.shlab.org.cn 研究方向 人工智能基础理论、人工智能基础软件和基础硬件系统、人工智能核心技术、人工智能开放平台、人工智能应用、人工智能伦理与政策 我们的优势 全球顶尖的AI科研团队 由汤晓鸥、姚期智、陈杰领衔,通过全职、全时双聘等灵活合作方式,
积极克服疫情不利影响,在应对变局中育新机、开新局,以“我敢闯、我会创”为主题的第六届中国国际互联网+大赛总决赛于11月17日在华南理工大学开幕。来自国内外117个国家和地区、4186所学校的631万人报名参赛,大赛期间,共有147万个参赛项目。众多国内互联网科技企业,积极参与大赛的数字化开发工作。以腾讯为例,旗下的腾讯乐享直播、腾讯同传、腾讯会议等产品,为大赛提供坚实的信息化服务保障。 据此,本届大赛中,包括牛津大学、剑桥大学、康奈尔大学、帝国理工学院、莫斯科鲍曼国立技术大学等诸多世界名校——世界前
在中考英语听说微技能系列在线训练课堂中,学生通过电脑、平板学生端参与口语任务活动,学生每一个单词的发音在2秒内得到了精确到音节级别的评估反馈。3月22日,在深圳市龙岗区全区初中英语教研会上,龙岗区外国语学校的三位英语教师正基于腾讯英语君教考练平台,尝鲜英语听说云端教学新模式。 腾讯英语君是腾讯教育面向英语教学及听说训练考试打造的智慧英语听说教学解决方案。腾讯英语君依托行业领先的人工智能技术,助力英语听说教学实现音素级口语评测,并且打通课前、课中、课后的教学数据闭环,实现个性化教学的同时,促进“双减”政策的进
很多人觉得AI是一个行业,但AI其实并不是行业,真实的情况是行业+AI,即原本的各个行业如何释放AI的能力促使产业升级,提升运转效率,创造更多的社会价值。
这类设备中都集成了麦克风和喇叭等电声器件,其中麦克风用于识别用户的声音,喇叭用于播放设备对用户指令的反应。麦克风的性能是影响语音唤醒率高低的重要因数,而喇叭的性能会影响打断唤醒率和用户的主观体验。接下来将分两篇文章对麦克风和喇叭的一些主要性能参数进行解析,给大家在产品设计时选择声学器件提供一些帮助。
自从1977年恢复高考,40多年来,高考从未迟到,更未缺席。但,2020年的高考却创造了历史:因疫情的影响,推迟一个月。
本次测试板卡是创龙科技旗下,一款基于全志科技T3处理器设计的4核ARM Cortex-A7高性能低功耗国产评估板,每核主频高达1.2GHz。评估板接口资源丰富,引出双路网口、双路CAN、双路USB、双路RS485等通信接口,板载Bluetooth、WIFI、4G(选配)模块,同时引出MIPI LCD、LVDS LCD、TFT LCD、CVBS OUT、CAMERA、LINE IN、H/P OUT等音视频多媒体接口,支持双屏异显、1080P@45fps H.264视频硬件编解码,并支持SATA大容量存储接口。
不知道AI落地趋势变化是否已让你感知?2018年下半年开始,技术先发正在被产品、场景为王替代。
前段时间小编收到一份测试任务要求对搜狗输入法的语音功能进行评测。评测任务主要拆分为评测语料的选取和整理,硬件的调研和采购,评测工具的开发以及评测的执行和结果整理。小编负责评测工具服务端的开发工作,主要使用了websocket的技术,此次与大家做一个简单的分享。
罗超为虎嗅网、爱科技网撰稿,2013年5月23日发表于首页 Chrome浏览器昨日进行了升级,推出了全新的语音搜索功能,允许用户通过语音进行搜索。本次升级面向PC版。iPad和iPhone的Chrome仍停留在旧版本。 更准确的说法是Chrome浏览器终于与语音搜索进行了结合。在去年安卓4.1(果冻豆)中,Google便已推出Google Now,一款类似于Siri的语音助手产品。由于在搜索领域的积累,Google Now表现出比Siri更好的语言识别和搜索效果。Google Now是系统层面的一款应用。定
今年2月份,咨询公司OC&C出了一份报告称,预计到2022年,全球语音购物的交易额将从20亿美元增长到400亿美元。
中国教育装备展示会是由中国教育装备行业协会主办的全国性教育装备专业展会,以整合营销、调节供需、技术推广、聚焦联系和交易、产学研结合与产业联动等为功能,已发展成为我国乃至全球教育装备行业规模最大、影响最广、专业性最强的品牌展会。
在日常工作、学习、生活中,笔记软件成为重要的生产力工具。然而,如今的笔记软件百花齐放:云文档? 云笔记? 离线笔记? Markdown 编辑器? 块编辑器?双链笔记?在每个类别中,都有几十款比较有名的笔记软件。那么,我们应该如何选择这些适合自己的笔记软件呢?
【新智元导读】 以语音起家的科大讯飞 2017年在计算机视觉上发力,接连获得自动驾驶领域权威评测集 Cityscapes 第一名和医学影像权威评测LUNA冠军两项突破,在视觉上展示出强大实力。 近日,科大讯飞在国际自动驾驶领域权威评测集 Cityscapes 获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界记录。这也是今年科大讯飞继医学影像权威评测LUNA之后在计算机视觉领域获得的又一殊荣。 📷 科大讯飞名列Cityscapes榜首 Cityscapes评测数据集在2015年由奔驰
机器之心发布 字节跳动AI Lab机器翻译团队 作者:董倩倩 语言是人类社会最自然、最有效的交流方式之一,是人类文化融合和信息传播的主要工具。随着全球化与信息化时代的到来,国际间的交流以及信息传播呈现爆发式增长,让计算机理解不同语言并实现语言之间的自动翻译成为人类社会的迫切需求。 语音作为一种自然、便捷且传递信息丰富的语言承载形式,是人类与机器交互的理想方式。 道格拉斯・亚当斯在小说《银河系漫游指南》中提到过一种叫做巴别鱼的神奇生物:体型很小,靠接受脑电波为生。人们可以携带它,它从脑电波中吸收精神频率,转化
这就是科大讯飞在618年中大促中交出的答卷,也是这家AI公司如何深挖价值红利的初步回答。
11 月 29 日,在线英语启蒙教育品牌叽里呱啦在北京召开“让天赋发声”品牌发布会。叽里呱啦联合创始人兼 CEO 谢尚毅首次对外公开品牌战略,围绕内容、教研、科技三大教育内核,打造教育 IP,积蓄产品力,搭建英语启蒙教育的护城河。
阿里江湖中,很多资源和技术,如神龙服务器、OceanBase、POLARDB等等,在开源、自研、云这三架马车上形成协同效应,既是内功也是武器。
【新智元导读】微软语音识别技术24年老将黄学东近日被评为“微软全球技术院士”,成功摘下这一微软技术的“桂冠”。 黄学东于1993年加入微软。1995年,黄学东最终把洪小文也拉入微软。黄学东还曾在Bing工作,一直跟随沈向洋博士。接受新智元的专访时,他谈到了去年微软对话语音识别词错率低至5.9%背后的故事。 同时,黄学东认为语音识别的下一个大难关是语义理解,目前看来最有希望的路线是 LSTM + Attention。 黄学东,微软语音识别技术 24 年老将,IEEE/ACM 双科院士,微软深度学习工具包CNT
腾讯犀牛鸟精英人才培养计划是一项面向学生的校企联合培养方案,项目覆盖机器学习、量子计算、计算机视觉、语音技术、自然语言处理等产学研热点方向,入选学生将到腾讯开展科研访问,基于真实产业问题,借助腾讯海量数据、专家指导等资源,验证学术理论,加速成果应用转化,全面提升自身科研能力和综合素质。 2018年度申请时间已经过半,小伙伴们要抓紧哦~ 今年共有8个课题方向,54个子课题供大家选择,总有一款适合你! 课题方向及导师介绍请持续关注系列推送 机器学习及其相关应用研究 1.1 用户行为时间序列分析及建模 利用
教育技术的迭代发生了很多次,如果把学校教育作为知识传播的核心来讲,第一次迭代是邮寄函授,第二次迭代是广播电视大学的出现,第三次迭代就是互联网。
朋友们,今天鹅老师要给大家上一堂英语课。now,我们先用一组chinglish热身一下,请跟我read: Give you some color see see (给你点儿颜色瞧瞧) You look whatlook you so what ! (你瞅啥瞅你咋地!) Where cold where stay (哪儿凉快哪儿呆着去) 在学英语的过程中,Chinglish(中式英语)总是让人哭笑不得,不地道的英语发音更让人头痛。 但每一个英语口语渣渣的你,总有许多理由: 小时候说不好英语,是因为
你或许会说,语音识别和机器翻译——没错,传统的语音翻译通常采用语音识别和机器翻译级联的方式实现,对输入语音先进行语音识别得到文本结果,然后再基于文本进行机器翻译,这也是当前语音翻译采用的主流方法。
随着AI技术深入到各行各业,AI也不断暴露出一些风险隐患,包括人脸数据的滥用,算法歧视,算法鲁棒性等,AI所隐藏的风险也越来越被大众所重视。虽然AI确实给各行各业提供了新的加速器,但是却也在慢慢丢失大众对它的信任。基于此,可信赖人工智能被越来越多的提及,越来越多的政府和企业都加入到了可信AI的发展和共建队伍中来。可信AI已经成为全球共识,也是行业发展的必然趋势。那什么是可信AI?如何确保和评估AI是可信的呢? ▲为什么需要可信AI? 人工智能技术引发了信任危机,主要有以下几个场景:算法安全性,算
关键技术顶天,行业认知立地。当打破了实验室和现实的隔阂之后,技术不再局限于自身,而是和广大的外部场景做关联,最终成就了科大讯飞AI技术能够迅速从研发到规模化落地的能力。 作者 | 月行、青暮 编辑 | 岑峰 自然语言处理(NLP)一直是人工智能渴望攻克的难题。 直到2006年,来自上世纪末的互联网时代累积的大量电子化的文本数据,以及深度学习的加持,终于让机器翻译乃至自然语言处理,走上了快车道。 深度学习秉承统计方法的概率传统,不同的是,它基本不需要做特征工程,而特征工程需要大量的专家知识。 但盛志超发现,
2017 年人工智能继续强势发展,基础研究和产业落地的进程都令人瞩目,既有众多令人兴奋的研究成果,又有持续落地的产业应用案例。科技巨头大力推进技术研究和平台建设,创业公司在摸索场景应用中快速崛起,早期项目也逐渐建立起自己的商业逻辑。 在此背景下,机器之心推出首届「Synced Machine Intelligence Awards」年度奖项评选,希望通过四大奖项来记录过去一年人工智能的发展与进步,更希望最终获奖企业的成绩与经验能够为所有的人工智能从业者带来灵感与启发,以实现人工智能的更大发展。 在奖项征集期
“结构清晰,主次分明”,用解构的方式去理解一款产品,这才是人工智能从业者思考的专业化表现。
ASR 作为机器学习的基础应用之一,已成为众多业务支撑的基础能力,在录音质检、音频字幕、会议转写、语音输入等场景中发挥越来越大的作用。腾讯云 ASR 作为业界领先的语音识别服务提供商,为开发者提供语音转文字服务的最佳体验,具备识别准确率高、接入便捷、性能稳定等特点。 基于腾讯的多个 AI 实验室的模型赋能,腾讯云 ASR 团队接入和开发了多种类型识别服务,如一句话识别、录音识别、实时语音识别等,业务覆盖通用、金融、医疗、游戏等多种场景。此外,工程方面,团队在整体系统的复用性、接口性能、服务稳定性上也做了大量
本文介绍了语音合成系统的评测方法和指标,包括发音准确性、韵律准确性、字典覆盖度、字词清晰度、韵律平滑度、自然度、无意识错误、声音属性、声音相似度、音频质量、生成语音的清晰度、听众的接受度、发音和韵律等。同时,还介绍了一种基于主观评测、客观评测的评测方法,包括MOS、错误检测、语音识别、声学模型、发音和韵律等评测指标。
然而,创业并非易事。更重要的是,他们选择以一项在当时不被看好的技术——语音合成起家。
ASR 作为机器学习的基础应用之一,已成为众多业务支撑的基础能力,在录音质检、音频字幕、会议转写、语音输入等场景中发挥越来越大的作用。腾讯云 ASR 作为业界领先的语音识别服务提供商,为开发者提供语音转文字服务的最佳体验,具备识别准确率高、接入便捷、性能稳定等特点。
领取专属 10元无门槛券
手把手带您无忧上云