首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

干货 | Siri 语音识别的小心机:你在哪里,就能更准确地识别那附近的地址

近年来,由于深度学习技术的广泛应用,自动语音识别(ASR)系统的准确率有了显著的提高。...然而,人们目前主要是在通用语音识别方面取得了性能的提升,但准确地识别有具体名字的实体(例如,小型本地商户)仍然是一个性能瓶颈。...我们决定通过将用户地理位置信息融合到语音识别系统中来提高 Siri 识别本地 POI 的名称的能力。...自动语音识别系统同城由两个主要部分组成: 一个声学模型,用于捕捉语音的声学特征和语言学单位序列之间的关系,如语音和单词之间的关系 一个语言模型(LM),它决定了某个特定的单词序列出现在一种特定的语言中的先验概率...在部署好基于地理位置的语言模型后,我们的自动语音识别系统的输出将具有特殊的标记,例如:在通过类语言模型框架识别的地理实体周围会有「\CS-POI」标记。

1.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

当直播电商用上 AI 实时翻译,歪果仁也能听懂李佳琦

今年,阿里旗下的速卖通就赶在「 11」之前,推出了多语言实时翻译服务,方便全球的消费者们一起来「剁手」。...关键词: 11,跨境直播,AI 实时翻译 距离「 11 」还有半个月,然而各大电商平台早已经开始摩拳擦掌,纷纷将预售时间提前,抢占先机。...「 11」的购物潮流也已触及全球 200 多个国家和地区 不过,在「 11」全球化的同时,也面临着新的挑战。...AI 实时翻译:消除跨境直播的语言鸿沟 为了帮助中国跨境商家更好地触达全球消费者,让歪果仁也听懂「噢尬」、「我的妈呀」、「所有女生,买它!」...跨境直播,对实时翻译提出了新要求 目前市面上不乏语音翻译工具,但是,在跨境直播这一特殊场景中,对语音翻译又提出了新的要求。

5.5K41

极客DIY:如何动手“组装”一个机器人

: 淘宝买了一个塑料盒子,买了一块触控屏,买了麦克风,小音响,所有东西都堆积在一起,充电宝供电,一个小的WIN10操作系统,控制程序自己编写的,首先:我尝试利用了麦克风,调用“百度语音”进行识别(PS:...虽然识别率不咋的,但是起码是免费的啊),再采用“图灵语义识别”,进行对话,在用“科大讯飞”生成自定义语音, 一个很基本的,小机器人就开发完毕了,可以通过WIFI,4G等情况下进行了基本的远程控制。...【环太平洋电影中的机器人】 好的,继续改造,由于经费有限(都是自费啊,没钱就刷着信用卡材料),我把原来的配件都拆了,开始进行机器人仿生设计。...【上图为机器人的操作系统】 功能参数: 一、支持语音识别语音对话、人脸识别,自定义语言类型为基本功能 二、支持远程控制,不限距离,毫秒级响应速率 三、支持远程人体动作同步,可让机器人模仿你的动作进行运动...通过百度语音识别后,再将识别的内容,发送到“图灵语义系统”去,这样就可以获得机器人的“回答”了,接着只需要用科大讯飞,进行文字转语音的操作即可。 ? 关于人脸识别系统:只要对着机器人说:我多少岁啦?

2.6K50

面向NLP的AI产品方法论——如何通过数据分析迭代优化

出门问问这一块做得比较细致,页面层级比较深,期望用户能够给予更精准的反馈,到底自己的AI助手哪里做的不够好。...来源3、关键词搜索+情绪识别 前面的基本是用户使用GUI交互行为表达了不爽,但是这个范围依旧不够大,我们需要继续延展。...找出正常的用户后,进行分析统计,比如4个槽位,仅仅填充了2个,用户努力对话几轮后,放弃掉了,哪里卡住了,哪里半途放弃了,这种就非常值得研究。很容易形成一个数据漏斗,看看问题主要集中出现在哪。...以用户A举例,该用户在当天3个不同的时间段,产生了3次会话行为,总共激活了5个业务,总计产生了11句对话轮次。...无法识别意图、触发认怂话术。 兜底闲聊能接上话就好,一般AI认怂话术是,“抱歉我不明白,请对我说blablabla……” 如果上面的例子比较扯的话,来看下面在电影场景下正常一些的例子。

2.3K10

智能车的「ChatGPT时刻」,还有多远?| 模力时代

△骁龙座舱平台效果展示 规划路线这种事儿也变得充满巧思,数字助手会根据你的习惯,主动问你:“路上杯咖啡不?”...更关键的是,骁龙8295搭载核NPU,AI算力从8155的4TOPS直接跃升至30TOPS。 这样的参数性能,放在车规级芯片上,可以说是一骑绝尘。...以搭载了骁龙8295的极越01为例,云端的语音识别算法模型直接放在车端,实时响应时间能从1.5秒缩短到700毫秒。 除了常规自主泊车,还能在车外语音控制车辆实现自主泊车。...车内,在骁龙8295的支持下,极越01能实现对不同说话人的识别,也就是支持多人同时语音功能。配合离线语音库,即使没有网络连接,也能实现全功能语音识别。...归结原因,核心其实是,数据在哪里,AI推理就应该在哪里进行。 一方面,云计算推理成本正随着大模型应用用户数量的增加和模型参数规模的增大而急剧增加,需要充分利用端侧算力来平衡成本。

13910

九年11让中国快递业世界领先,下一个九年会发生什么?

每年11是电商零售行业的盛事,也是物流快递业的大考。在我印象中,过去每年11过后,都会伴随着物流爆仓、快递小哥累到不行的新闻。...每年11我都会参与剁手,前几年来自外省的包裹要等一周甚至两周才收到,但今年11的东西尽管到货没有平日快,却也在两三天内陆陆续续到达了。...翻了下朋友圈,发现关于包裹延迟到达的吐槽也比往年少了许多,11物流这个老大难问题似乎已经得到顺利解决。 快递终于不再是11的瓶颈 今年11快递行业比往年“好过”,有些出人意料。...可以说,今天中国快递行业的服务能力已是九年前不可同日而语,快递运力、速度、效率和成本都做到了全球领先,什么都可以送、哪里都可以去,成为中国经济发展中与互联网、电商并列的一道奇迹,能够支持交易额大幅攀升的...电子面单等技术实现了物流各个环节的数据收集,为智能物流打下基础,物流快递行业已在利用电子化获取的大数据进行智能调度,比如顺丰利用机器学习等技术来预测快件量,预测粒度可细化到每一个派送网点,进而进行更合理高效的资源配置;再比如顺丰利用图像识别技术来识别面单

5.6K60

解密:依图如何一年实现语音识别指标超巨头玩家

12 月 11 日,擅长计算机视觉技术解决方案的依图科技在北京公开展示了语音识别领域的最新技术成果,并表示将在近期开放依图语音识别 API 接口以及部分测试数据集。...吴:依图自有的数据集、算法 API 将在近期公开。在所有公开数据集上的测试结果均可复现上述结果。...吴:上述测试涉及到了多种硬件设备,比如智能音箱、手机以及其他硬件设备。我们希望能够覆盖更多硬件设备。硬件方案的确会影响语音识别效果。但是面向不同的识别场景,我们都是调用同一套算法,同一套 API。...谈到语音识别领域的研发历程,吴表示,大约是一年左右不到的时间,即去年底今年初投入力量进行语音识别方案的研发,但在语义理解层面,依图已经有所建树,比如在医疗领域,电子病历理解的应用。...目前,依图语音的表现是相对意义上的性能提升,平均算法性能领先 11%,在某些特定的场景下领先更多。

4.3K30

1万元的iPhone X太贵买不起?至少中国富人穷人都买得起

排除连iPhone 8和iPhone X都不区分的“恶意差评”,我们来看看iPhone X最被差评的地方在哪里:全面屏、无线充电、面部识别摄像头光学防抖在安卓阵营都已有先行玩家,iPhone X不过是跟随...因为唱衰苹果的分析师没有站在用户角度思考问题,消费者的不是创新,的是体验,摄像头不是苹果先做的,但做得更好。 同样,iPhone X的体验提升是十分显著的。...如果说摄像头、无线充电、OLED屏幕、A11处理器是优化还符合事实,但去掉HOME键和全新功能Face-ID,却着实算属于苹果的创新。...FACE-ID有红外活体识别而不只是图像识别技术,通过红外传感器、点阵投影等多个传感器组合的“深度摄像头”带来快速、精准和安全的识别,以及Animoji等创新应用。...在楼市和股市有所斩获的人,如果已是iPhone用户,换机概率很大,iPhone X送礼的几率也更大,且别忘了,iPhone X正式开卖的11月,是中国的黄金购物季,iPhone历年是明星产品,今年iPhone

3.2K70

漆远:小数据学习和模型压缩存挑战,场景成为 AI 技术发展关键

我们当时做这个项目,应用在11实时预测的用户产品推荐上,后来变成了阿里巴巴第一个大规模机器学习平台。所以一开始你要找到一个商业价值的落地点,如果我们做参数服务器,同样的技术,就是死路一条。...它带来了图像识别语音识别、NLP 等领域的长足进步,但是它的落地点在哪里?这就要问你的核心价值在哪里。一开始我们就很具体,就做客服。...“蚂蚁金服正在构建人工智能方方面面的能力和应用,我们在能力上的配备还是比较标准的——机器学习、自然语言处理(NLP)、图像识别语音识别,尤其是语音识别,完全使用的是阿里集团自己的语音识别能力。...客服项目在蚂蚁金服可以说是第一个标杆性的人工智能落地项目,它一开始是典型的人力服务工作,在成都客服中心有几千人,每年11接电话非常繁忙。...我们做了大约半年,自助率从60%一下子升到94%,2016年自助率高达97%,去年11最忙的时候,客服小二实际上非常轻松。今年我们有了一个新的标杆性的指标,两三个星期前刚刚做到。

3K30

讯飞翻译笔s11,学生们的新福利

首先,AI、语音识别、大数据、交互技术等相关技术的成熟应用,为教育硬件的智能化升级奠定了基础。...比如,很多用户硬件,就是希望获得免费丰富的内容资源。...讯飞翻译笔S11的推出,无疑是科大讯飞追求极致产品力的又一力作。 在效率方面,S11继承了讯飞翻译笔S10的高识别率特点和听说读记多场景应用能力,并且还在一些方面取得了新突破。...另外,S11支持S10并不具备的听力素材自主导入播放功能,全新升级的牛津高阶英汉双解词典也将为S11所独有,这无疑将大大提升其专业能力。 此外,S11还在很多产品细节上用足了心思。...从技术层面来看,讯飞翻译笔的扫描、识别、翻译等功能,涉及OCR识别、机器翻译等人工智能技术,而在人工智能技术领域深耕20多年的科大讯飞,在这些技术上已经达到了世界领先水平。

4.1K40

OPPO R15来了,网友:刚买了R11s,就出R15,你觉得我还会吗?

配备了后置摄像头,而前置摄像头依旧采用了到 2000万像素。...网友:我刚花了两千八买了R11s,马上就出了R15,才三千,啊啊啊[震惊][震惊]!你觉得我还会吗?是的,你猜对了! 网友:老子刚的R11S没两天,你跟我说要出R15?????...所有的钱都用来给明星代言费,试问你的手机研究经费能高到哪里?质量?这种机子我们业内叫它“一次性手机”。 网友:有些人能别觉得自己最清醒吗?...大家还是参考下值不值得 好了 才几个月研制的新机 也不会有太大突破。所以还是会有很多追星族,义无反顾的的。才刚r11s,反正买不起!...网友:我刚的R11s跟我闹着玩么?我刚换的r11s那么快就有新的了?手机不咋滴,卖的倒是挺贵,你是想说让我和她们用一样的手机吗?你看她们粉丝买账吗?

10.5K70

创业使人成长系列 (1)

11年开始的团购千团大战、14年国内打车大战、15年O2O大战、16年的共享单车大战,每一次大战剩下来的都没几个。踩不中风口,跟随风口创业几乎都失败了。...15年提倡创,大众创业、万众创新,现在回过头看,当初那么多人创业,活下来的有多少,现实数据充分说明了创业成功是小概率事件。失败才是正常的。 二、用收获衡量得失,而不是世俗所谓的成功。...所有人员大部分来至原来团队,需要每个员工自己入股,采取的形式是1万给2万的股,不同岗位可购买的额度不同。如果失败,则购买股份的钱会退给你。工资也是正常发放。当时觉得条件挺优厚的就加入了。...最直观的感受是,当初为什么做陌生人语音社交?原因就是原来公司就是专门做语音交互的。...不仅在技术上陷入了价值网依赖,在很多运营策略上也照着大公司的运营思路去做,当初光域名都花了好几万,其实这个对创业公司重要吗?仁者见仁智者见智吧。

53810

一文看尽Google IO大会:史上最快手机全语音操控,不开口也能打电话,安卓Q登场

你想买一鞋: ? 或者小朋友想了解大白鲨: ? 那有没有可能是看到一张图片,也想知道更多相关信息? 谷歌说Google Lens——智能拍照\图搜应用,为此而生。而且不是拍照识别那么简单。...更厉害的是语音识别速度保持在1秒以内,比用手更快。 现场小姐姐的演示,搞得人心激动。 ?...Google这次展示了Live Relay的技术,用语音识别和TTS,帮助聋哑人士接电话。 ?...比如刚才说到的视频实时字幕,背后核心是AI语音识别转写。 但!是!Google放出大招,即便不联网,现在也能在最新安卓系统中实现实时语音转写。...现场展示照片,单摄的Google手机,夜景成像吊打摄的iPhone X。 ? Pixel 3a定位中端旗舰,依然传承谷歌“软件送硬件”传统,承诺连续3年的软件和安全更新。

1.6K30

Google IO大会:5G和折叠屏来了,还有这些改变世界的黑科技

你想买一鞋: ? 或者小朋友想了解大白鲨: ? 那有没有可能是看到一张图片,也想知道更多相关信息? 谷歌说Google Lens——智能拍照\图搜应用,为此而生。而且不是拍照识别那么简单。...更厉害的是语音识别速度保持在1秒以内,比用手更快。 现场小姐姐的演示,搞得人心激动。...Google这次展示了Live Relay的技术,用语音识别和TTS,帮助聋哑人士接电话。...比如刚才说到的视频实时字幕,背后核心是AI语音识别转写。 但!是!Google放出大招,即便不联网,现在也能在最新安卓系统中实现实时语音转写。...现场展示照片,单摄的Google手机,夜景成像吊打摄的iPhone X。 ? Pixel 3a定位中端旗舰,依然传承谷歌“软件送硬件”传统,承诺连续3年的软件和安全更新。

1.3K60

11 | 正是一年好风光,AI特惠心不慌

半价折扣、1元购、邀新赢大礼、抽奖应有尽有 跟着,不迷路 腾讯云AI没套路 具体来说↓↓↓ AI专场特惠:6折起 AI专场推出的特惠购产品包括: 人像变换 7折、人脸试妆 7折、人体分析 7折...人脸识别 7折、人脸核身 7折、文字识别 6折 语音识别 6折、语音合成 6折 活动时间 即日起至2021年11月30日 除了实实在在的产品折扣 双十一活动订单享10%满返 双十一AI专场 https.../act/double11?...from=15239 双十一特惠OCR:限时1元购 推出通用印刷体、手写体、身份证、营业执照 车牌识别等8大爆款子能力(限新用户) 特惠1元购买,持续整个11月 OCR 1元购地址 https://...,自动查找商品 让你不用再费了老劲找心仪的它 即便一只口红,你也可以通过在线试唇色 买到最适合你的唇色 最后再来个刷脸支付 整个购物流程“如丝般顺滑” 语音技术 自动识别,将语音转换为可识别机器语言

15.6K30

一名python学习者打开11的正确姿势

1111日是个有趣的日子。客观来说,它和一年中其他364(365)天一样没什么特殊,但偏偏又总被人赋予特殊的含义。...打算再等等的商品,准备的时候居然价格涨回去了! 所以别看折扣打得狠,优惠券给得大方,你究竟有占到多少便宜,自己心里还真没点数。...图片价格的话也可以考虑用 OCR 识别。 还有更复杂的,比如对用户浏览行为进行判定,以及对异常请求的返回数值做手脚等等。因为对抗难度较大且需要具体情况具体分析,这里不展开讨论。...等你开发出这套系统,每天自动抓取,明年11的时候就可以更理性地买买买啦!(手动滑稽 什么?你觉得费劲折腾这个并没有什么用? 好吧,你以为我真的是在跟你谈论11怎么省钱吗?...而“11”到底是真的实惠,还是平台和商家的套路,我也一点都不关心。

20.4K70

人机交互如何改变人类生活 | 公开课笔记

后来做语音识别语音识别那个年代也都是玩具,所以那个年代做人工智能的人最后四分五裂,因为根本活不下去,后来就跑去做搜索引擎、跑去做金融、跑去做其他的行业。...语音识别当然是最基本的,这个已经非常非常成熟了,可不可以知道这句话到底代表什么意思?语音把它转变成文本,如果可以的话还可以知道你的语气,你的语音情绪是愤怒还是悲伤,还是高兴?...语音转文字效果不好,如何提高意图识别准确率?...这其实是包含语音识别在内的,语音识别大家的普通话不一定很标准,像我也是有口音的,所以我语音转转文字,可不可以把它转成拼音,我把平舌、翘舌、前鼻音、后鼻音把它去掉,这样ch就跟c是一样的,zh就跟z是一样的...11.怎么知道机器的回答对不对?

1.8K10
领券