提出论点 好的研究想法,兼顾摘果子和啃骨头。...两年前,曾看过刘知远老师的一篇文章《好的研究想法从哪里来》,直到现在印象依然很深刻,文中分析了摘低垂果实容易,但也容易撞车,啃骨头难,但也可能是个不错的选择。...初入团队,寻找自己的立足点,需要一个好的工作想法。每年末,抓耳挠腮做规划,想要憋出一个好的工作想法。很多同学,包括我自己,陆陆续续零零散散想到很多点,然后自己不断否掉。...人的三维+时间半维 具体如何找到好的想法,一时半会没有头绪。因此,回到最初的起点,从人的层面,我有什么?我想要有什么?...引用 好的研究想法从哪里来 杜跃进:数据安全治理的基本思路 来都来了。
在整个跟读环节,「语言海洋泡泡」首先利用「一句话识别」功能对儿童语音进行转换识别,再利用「句子相似度」进行评判。产品还会根据孩子的普通话水平,智能匹配相应的学习音频,助力儿童高效学习普通话。...实际上,几位成员之前并没有自然语言处理产品的项目经验。在这个过程中,腾讯云担任了「最强技术助攻」的角色,提供了关键的语音识别技术支持。...「语言海洋泡泡」的核心落地场景在于跟读过程的语音对比,在每一个泡泡下,都包含一条 10 秒之内的普通话教学语音。...团队成员提到,基于腾讯云开放的「实时语音识别」和「一句话识别」两项功能,他们不再需要从零开始设计算法,直接调用 API 就能实现产品的语音识别功能,大大减少了项目手写代码的工作量。...一位负责开发的成员表示:「这样一来,我们就可以把更多的时间放在产品功能的实现上,省去了代码上的很多基础工作。」 腾讯云提供的语音识别开发者资源。
张家辉在某广告中,将自己的名字念成“渣渣辉” 面对扁鼻音,剩下的50%南方人也被刷掉了。 如何拯救普通话? 过去,中文口语评测高度依赖专业教师听后进行主观评估,成本高、费时费力。...功能特性 全年龄段覆盖 支持从儿童到成人,全年龄段覆盖的中文普通话评测打分,针对儿童提供个性化、差异化的评测能力支持。...不是专家,胜似专家 智聆口语评测的语音评测打分结果与专家打分拟合度 95% 以上,可广泛应用于普通话教学业务中。...应用场景 1 普通话评测 根据普通话水平测试规范,分别进行单音节字,多音节词语,文章朗读进行普通话发音打分,估算考试成绩。 ?...2 幼教发音启蒙 可针对幼教场景下的语言学习,针对字、词、句子等的发音情况进行语音评测。 ? 3 口语作业批改 可针对培训机构的课后朗读课文以及唐诗等,在学生提交的时候进行在线批改。 ?
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第5篇,也是最后一篇。...评测语音技能的智能程度有4大维度: 如何评测语音技能的智能程度(1)——意图理解 如何评测语音技能的智能程度(2)——服务提供 如何评测语音技能的智能程度(3)——交互流畅 如何评测语音技能的智能程度(...例如:某语音技能的定位是用来听歌的,“意图理解“中的模块做得非常好,但是由于版权原因,很多歌曲无法播放,这个技能的用户体验就会非常糟糕,因为满足不了用户听歌的需求。...ASR这项技术未来差距很可能会被抹平,而如果做到了方言转普通话然后转文本那就是另外一个话题了,方言转普通话和任何一种语言转普通话是同一个逻辑。那笔者可能会归纳到【意图理解】维度上。...语音技能服务的上限和下限 除去调研和评测其他智能语音技能,这份清单的还可以用于服务的产品定位,以及作为清单来评价语音技能服务表现。
未标题-1.png 概述 腾讯云智聆口语评测(英文版)(Smart Oral Evaluation-English,SOE-E)是腾讯云推出的语音评测产品,是基于英语口语类教育培训场景和腾讯云的语音处理技术...,应用特征提取、声学模型和语音识别算法,为儿童和成人提供高准确度的英语口语发音评测。...腾讯云智聆口语评测(英文版)支持单词和句子模式的评测,多维度反馈口语表现,可广泛应用于英语口语类教学应用中。...本 SDK 为智聆口语测评(英文版)的 Web 版本,封装了对智聆口语测评(英文版)网络 API 的调用及本地音频文件处理,并提供简单的录音功能,使用者可以专注于从业务切入,方便简洁地进行二次开发。...默认值 InitUrl String 初始化接口地址 是 无 TransUrl String 评分接口地址 是 无 WorkMode Integer 上传方式:语音输入模式
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第2篇。 “你是做什么行业的?”...在厨房这个场景下,屏幕上可以语音搜索,做菜烘培类的视频资源等,可以用知乎,抖音,下厨房等任意地方的内容,这个细分领域,维系好内容建设,成本并不高。...再比如说,市面上一些热门游戏,已经有了自己的智能助手,有些做的好,有些不好。 在这里可以寻求的服务可以有:提供游戏攻略、提供客服入口以及服务、收集用户建议,做运营营收类动作一类系统整合服务。 ?...机器人会非常细心的告诉我,先点哪里,然后点哪里,然后点哪里就可以找到了。 问题就是他是一串纯文本,为什么就不能给我一个直接跳转到指定页面的功能按钮呢?显然,它并没有提供一个【跳转】的功能样式。...所以评测点是,是否能够理解用户需求,使用丰富的反馈样式,提升用户体验。 【服务提供】(4)内容展示合理程度 这一块其实非常考验人的设计功底,好的UI界面一定是简单而优雅的。
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第1篇。...至于处理逻辑是直接给于结果,还是通过追问的形式二次判断,就是具体业务具体场景的选择了。 不过多举例,但是有无处理方案,应该纳入进评测点。...AI回复,好的,你想从哪里到哪里?用户第二句话:从北京到上海。AI回复,您想什么时候出发?用户第三句话:明天下午出发。AI回复,为你找到如下车次,请问你想要第几个。用户第四句话:那就第一个吧。...好的完善和引导,则是: 如果用户填充了AB,AI应该追问CD的例子:我想看《魔童哪咤》,帮我在附近找个最近的电影院。...笔者可以讲清楚是什么,解决方案以及思考后续会以独立文章的形式分享。 既然是评测指标,自然是有权重之分。
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第3篇。...【交互流畅】(1)服务稳定性 “正常运行”、“不出bug”、“鲁棒性好”。 评测点已经讲完了,十分清晰,几乎每一个互联网从业者都能够说出个1234,然后呢?...当用户发出了需求,希望尽快拿到反馈, 现在的用户极其没有耐心,速度一旦过慢,注定会被弃而不用。 ? 而在智能语音助手交互对话的过程中,又包含哪几个阶段呢? ? 先明确一点,一味追求快并非是好。...人们去饭店点完了菜,等上菜的过程中,中间服务员还会过来帮忙缓解,这个过程较长,一定要考虑好等待体验管理,不至于让用户无聊。...而当我们的产品被用户首次体验的时候,如果没有新手教学,用户也许就呆滞在那里,并不知道如何使用。 新手教学体验是非常重要的一个环节。 体验各家智能语音助手,在这一块的表现上各不一致,故而列为评测点。
一、引言 小编新接触语音SDK项目,SDK无UI、底层调用多个C++算法库、提供的是AI服务。语音AI项目,识别效果是至关重要的一环,识别效果评测也是一项测试重点。...希望对测试小伙伴有所帮助~~(●—●) 二、ASR流程、系统结构、评测指标及评测模型 1、语音识别(Automatic Speech Recognition,ASR) 语音识别,也被称自动语音识别,所要解决的问题是让机器能够...语种分类(普通话 方言 英语 小语种 混合语言) (3). 语音内容/领域(日常话语 非日常话语)【不同行业 不同场景】 (4)....录入语音时长(0秒 1秒 1分钟内 >1分钟) (10).对话方式(间隔 连续 单人 多人) (11).特殊发音(比如普通话中sh与s ping与pin l与n f与h) 四、ASR评测方案制定...1、ASR评测方案设计——确定测试场景(简单举例) 考虑评测的各种影响因素,需要先确定某些维度(下例),制定一个测试场景评测: 确定:语种分类(普通话)、声音来源(人声录音)、对话方式(单人)、语音内容
笔者使用中文普通话进行了一轮评测,识别效果超出我的预期。除了PC端使用场景有限,识别效果仍不够完善,最大的问题是:得访问外国网站。下面是一个简单评测。...这也是其与移动版Chrome的语音搜索和百度语音搜索一大不同。 7、Case1、较为标准的普通话:阿里巴巴的创始人是谁?准确识别,答案为马云。...除了网页外,还有图片、百科以及马云的好基友李彦宏杨致远等人的关联信息。 8、Case2、绝对标准的家乡话:中国的首都。...如果不访问外国网站,别说语音搜索,访问Google也会经常出现大家熟悉的界面。 评测总结: Google语音搜索对于中文用户来说具备可用性。...从评测看,Google表现优秀。其身在墙外,但对中文语音和语义识别能力,超出预期。 期待Google语音搜索接下来有两个进展。
依托科大讯飞的语音评测技术,P20还提供发音纠正功能,帮助孩子们及时了解自己发音的问题,及时反馈纠正。...至于最要命的口语练习,P20和P20 Plus必然是都支持的。 除了提供中英文自动语音翻译以外,还采用中高考听说口语评测同源技术,支持跟读评测,按照考试标准练发音。...评测结果是多维度的,AI算法评测解码和计算的核心模块,通过语音识别(ASR)解码转译,与给定的文本对齐结合发音的音素、语调、流利度、断句、完整度等内容,给出一个综合评分。...总体而言,科大讯飞在AI翻译笔上运用了:OCR识别、语音识别、机器翻译、语音合成、语音评测、语法分析、作文批改等技术。...在语音合成方面,则是取得了Blizzard Challenge国际语音合成大赛十四连冠佳绩。 除此之外,科大讯飞还是国家普通话水平测试及英语口语测试技术供应商。
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第4篇。...前三篇文章,依次拆解了【意图理解】、【服务提供】、【交互流畅】三个维度,如果这些维度的各个评测指标全部达标,即是一款水平线以上的智能语音助手,但是距离“令人愉悦和兴奋”还少了一个维度,即——人格化。...好,下面有请,NBA两届最佳防守球员,在NBA两只球队获得总冠军并2次捧起FMVP奖杯,前段时间又在2020年捧起全明星赛AMVP的当红炸子鸡——Kawhi Leonard发表自己的获奖感言。 ?...大厂制造,资源齐备,各个性能表现都十分优秀,同一个时期的产品,硬件配置,技能,语音交互表现差不太多。...高德语音导航这个工具的使用体验无疑是做得令人愉悦的,与它们的互动充满了乐趣。 ?
如果基于H5页面和小程序,微信分享一个链接,随时随地都可以去听课,这样就非常方便,而且用户体验非常好。 0007.jpg 我们看一下内部体验demo,左边是网页的内容,右边是小程序。...我们谈了很多合作伙伴,大家对于这块都有一些诉求,可能不同的企业不同的教育细分市场会有所差异。总结一下其中比较重要的问题有:我们的客户在哪里?如何控制成本?如何提高销量?销售和客服质量问题?...客户哪里不满意?如何缩短获客周期?腾讯云提供了关于营销的整体解决方案。我们从商机获取到转化跟进,有着讲解、评测、付费、服务的全流程支持,以此来帮助企业降本增效。...0021.jpg 语音评测包括普通话和英语的评测,从单词、句子、准确度、流畅度等各个维度去打分。...在语言评测方面,国内的其他友商也在做语音识别,对于低龄的孩子来说,普通话都讲不清楚,语音评测是很有难度的。这块成人和小孩子的标准是不一样的,小孩子是以鼓励为主,所以我们常规的维度去评测是不适合的。
智能锁,已经广泛的应用于生活的各个场景,确实是一个好产品,我自己都在用,也很方便而锁基本上都搭配有语音芯片或者蜂鸣器,低端的产品都是蜂鸣器,中端的产品基本都搭配语音芯片而智能锁方案中,关于语音芯片的需求第一种...不使用语音芯片,使用Flash存储,使用MCU的DAC加功放组成。这种方案有一定的门槛,稳定性和效果需要一定的能力。第二种,使用集成语音芯片方案。...这里强烈推荐KT148A-sop8的语音芯片,flash型,可以重烧,可以用户自己修改语音,当然,在多语音,长语音的应用中,成本是非常的有优势当然面对智能锁的需求,我们也开发了实用型的功能扩展超出255...地址范围的语音,很多otp的芯片最大也只能支持的255的地址,而flash的KT148A可以扩展到65535的地址范围极致的语音压缩,可以存储将近440秒的高音质,如果音质稍微在压缩一下,存放600秒也是可以实现的...,就需要做音质的取舍Flash型的语音芯片,最大的好处就是芯片只有一种,没有任何其他的型号,不需要区分物料,不需要担心库存,即使生产有异常,也可以在线烧录,不至于拆机或者报废KT148A用户自己下载语音的最小系统板如下
而计算机领域流行着一句话“IDEA is cheap, show me the code”,也说明对于重视实践的计算机学科而言,想法的好坏还取决于它的实际效能。这里就来谈下好的研究想法从哪里来。...那么什么才是好的想法呢?我理解这个”好“字,至少有两个层面的意义。 学科发展角度的”好“ 学术研究本质是对未知领域的探索,是对开放问题的答案的追寻。...深度学习之所以拥有如此显赫的影响力,就在于它对于人工智能自然语言处理、语音识别、计算机视觉等各重要方向都产生了革命性的影响,彻底改变了对无结构信号(语音、图像、文本)的语义表示的技术路线。...好的研究想法从哪里来 想法好还是不好,并不是非黑即白的二分问题,而是像光谱一样呈连续分布,因时而异,因人而宜。...那么,好的研究想法从哪里来呢?我总结,首先要有区分研究想法好与不好的能力,这需要深入全面了解所在研究方向的历史与现状,具体就是对学科文献的全面掌握。
“没想到我的中文语音测评分数竟然还没有英文高,看来我要好好练习一下自己的普通话发音了。”...来自深圳的孙小姐在微信小程序上评测完后,分享了自己的体验。 “ 有来头:解读智聆口语评测的“前世今生” 智聆口语评测是由腾讯云团队基于微信“智聆”的技术与应用基础,创新算法研发而成的语音评测产品。...“3”即三大产品特性 1 首先,智聆口语评测支持从儿童到成人全年龄段覆盖的英语语音评测打分,并且针对儿童提供个性化、差异化的评测能力支持 2 其次,全方位打分机制,通过发音准确度、流利度、完整度等多维度解读...同时,针对不同的用户,推出四大应用场景:在口语能力测评场景里,快速了解学生英语口语评测,提供多维度的语音评测结果,方便课程安排;在在线绘本跟读中,针对少儿英文绘本的单词和句子跟读的情况进行语音评测;在课堂质量评估场景...目前,智聆口语评测已经为腾讯众多合作单位的在线教育产品输出技术支持,如知名在线儿童英语教育机构Vipkid,就是通过接入智聆口语评测系统,为用户提供差异化的口语评测能力,帮助学生进行口语练习,取得了非常好的用户口碑
在对用户的指令理解和执行上,Bixby真正做到了三星所宣称的“能说会看懂你心”。 2017年11月21日,北京,三星人工智能平台Bixby中文(普通话)版在北京亦创国际会展中心正式发布。...应用全覆盖,Bixby让人机交互更自然 目前市面上语音助手型的产品使用率并不高,因为用户并不清楚哪些应用或是功能可以被语音支持。而Bixby则竭尽全力去覆盖手机中的常用功能,为用户带来真正的便捷。...另外许多语音助手要求用户能够丝毫不差的说出语音命令,这对于大多数的用户来说过于苛刻。...在所有这些现场演示中,Bixby都展示其强大的自然语音理解能力,并准确无误的执行了用户所发出的全部语音指令,其强大的语音识别和执行能力惊艳全场。...随着Bixby中文(普通话)版的正式发布,中国用户在11月30日便可在Galaxy S8以及Note8中体验全新的人工智能交互方式。
我六月底参加深圳的一个线下技术活动,某在线编程的 CEO 谈到他们公司的发版,说:“我说话的这会儿,我们可能就有新版本在发布。”,这句话令我印象深刻。...传统的单体应用,所有的功能模块都写在一起,有的模块是 CPU 运算密集型的,有的模块则是对内存需求更大的,这些模块的代码写在一起,部署的时候,我们只能选择 CPU 运算更强,内存更大的机器,如果采用了了微服务架构...可以灵活的采用最新技术 传统的单体应用一个非常大的弊端就是技术栈升级非常麻烦,这也是为什么你经常会见到用 10 年前的技术栈做的项目,现在还需要继续开发维护。...服务的拆分 个人觉得,这是最大的挑战,我了解到一些公司做微服务,但是服务拆分的乱七八糟。这样到后期越搞越乱,越搞越麻烦,你可能会觉得微服务真坑爹,后悔当初信了说微服务好的鬼话。...这个段子形象的说明了分布式系统带来的挑战。
对于想要在网络上建设网站的用户而言,首先需要为网站购买一个合法的域名,不过很多人对于购买域名并没有实际的经验,因此往往不知道在哪里才能买到需要的域名。那么买域名哪里好?域名供应商的选择标准是什么?...买域名哪里好呢 域名是外部用户访问用户网站的地址,只有准确的地址才能够让别人进入自己的网站,并且域名和网址并不是相等的关系,域名需要经过解析才能够获得网址。...域名的选择标准 很多人在网络上查找后会发现,提供域名的域名供应商在网络上是非常多的,那么买域名哪里好?域名供应商如何来选择呢?...其实有心的用户会发现,网络上的域名供应商虽然多,但不少域名供应商的都只是代理的性质,所提供的域名种类相对比较少,因此在选择域名供应商时应当尽量挑选那些一级域名商,这样可以选择的域名种类会更加丰富。...买域名哪里好?如何挑选域名供应商?
而计算机领域流行着一句话“IDEA is cheap, show me the code”,也说明对于重视实践的计算机学科而言,想法的好坏还取决于它的实际效能。这里就来谈下好的研究想法从哪里来。...那么什么才是好的想法呢?我理解这个”好“字,至少有两个层面的意义。 学科发展角度的”好“ 学术研究本质是对未知领域的探索,是对开放问题的答案的追寻。...深度学习之所以拥有如此显赫的影响力,就在于它对于人工智能自然语言处理、语音识别、计算机视觉等各重要方向都产生了革命性的影响,彻底改变了对无结构信号(语音、图像、文本)的语义表示的技术路线。...好的研究想法从哪里来 想法好还是不好,并不是非黑即白的二分问题,而是像光谱一样呈连续分布,因时而异,因人而宜。...那么,好的研究想法从哪里来呢?我总结,首先要有区分研究想法好与不好的能力,这需要深入全面了解所在研究方向的历史与现状,具体就是对学科文献的全面掌握。
领取专属 10元无门槛券
手把手带您无忧上云