正当你认为弄明白了机器学习…..bang!又一个科技新词出现了。 深度学习 虽然它看起来可能只像另一个所有新的创业公司都在用的硅谷流行词语,深度学习实际上已经取得了一些令人惊讶的进步。我们将在这讨论一些介于科幻与现实之间的东西。 我们找到了深度学习专家吴恩达,并让他来解释什么是深度学习和我们应该期望它如何在2016年改变世界。 什么是深度学习? 深度学习是机器学习的一个子领域,本质上是指尝试去比对神经网络(同样让你大脑工作的机制)。通过比对这些神经网络,我们可以重新创造出人脑工作时一些相同的过程。 其目标
以下为演讲实录: 吴恩达:谢谢,大家好,人工智能已经在世界有很大的影响力,百度是引领人工智能发展的公司之一,今天我想跟大家分享一些我们正在做的先进技术,我也希望未来我们能把这些技术开放给我们的合作伙伴。 从李彦宏讲的一席话里我们看到语音识别重要性,百度和北京团队一起正在研究新一代的语音识别技术,让我为大家演示一下。这是一段用户手机的录音,请大家仔细听听,你能听出他在讲什么吗。来。现在请大家闭上眼睛再听一次他到底在讲什么。有时候由于噪音、口音等等,很难听清楚电话那边的人在说什么,我们把这段语音放给我们
<数据猿导读> 51猎头CEO刘维在2016年中国信息通信大数据大会上分享了以“大数据认知时代下如何让人力资源产业更聪明”为主题的演讲。他讲到,传统招聘虽然非常土,但为现在的互联网招聘提供了一个业务基
总第235篇 2018年 第27篇 随着数字化时代的到来,外卖市场近年来发展非常迅猛。对外卖物流系统而言,配送效率和用户体验至关重要。而实际配送过程是由配送员(骑手)最终完成的,因此,想要真正提升配送效率,不但要在智能调度系统(订单指派、路径规划、ETA)上下功夫,还要不断提升配送员的“附加”能力,让他们越送越“熟”,越送越“顺”,越送越“快”。以此为出发点,美团点评研发团队设计了骑手智能助手,全面提升骑手的各方面能力。 在 1月份的 AICon全球人工智能与机器学习技术大会上,美团点评配送人工智能方向负
其中隆重介绍了自己加入Zoom六个月之后创新的成果——Zoom AI Companion,以及驱动Zoom AI Companion的Zoom联邦(federated approach)AI。
雷锋网按:5月20日,由中国计算机学会(CCF)主办,Xtecher协办的2017 CCF青年精英大会在北京国家会议中心举行。中国工程院院士赵沁平、香港中文大学教授汤晓鸥、百度创始七剑客之一雷鸣等围绕“科研·产业·融合”这个主题做了一些分享。其中,汤晓鸥教授做了题为《人工智能的明天,中国去哪?》主题演讲。 在汤晓鸥教授看来,不管中国人工智能接下来如何发展,不管年轻人如何创业或者做研究,我们要做的只有三件事:坚持、创新、以及落地。 在谈到“在中国创业是怎样一种感受”时,汤教授称,“创业的困难是一定存在的,年轻
AI科技评论按:距离苹果Siri的推出已经快6年了,期间很多智能手机厂商也纷纷将语音助手列为卖点之一,但是其使用率一直不高,究其原因,还是语音助手的功能有限。不过随着深度学习带来的技术进展,以及亚马逊
【新智元导读】新智元100创业调研第一期走进云知声,与CEO黄伟面对面访谈,探究三大问题:如何在谷歌等开源趋势下,开发差异化产品;如何押注物联网AI,突破车载、家居、医疗领域应用;AI创业公司如何避免泡沫,应对资本寒冬。AI创业典型公司,一手数据首度曝光。 “新智元100”是新智元旗下专注AI创业与投融资研究的子品牌。“新智元100”正在寻找中国最具竞争力AI初创企业。欢迎企业报名参与调研评选。 新智元100创业调研第一期,走进云知声。 提到云知声,业内人士通常会同时想起国内的科大讯飞、思必驰和捷通华声
【新智元导读】当地时间7月7日上午,第七次“16+1”领导人会晤在保加利亚举行,李克强总理应邀到访。在人工智能产品区域的科大讯飞展台,两位总理用翻译机进行了有趣的互动,总理还亲自购买翻译机赠送给保加利亚总理鲍里索夫。
电影《Her》讲述了一个宅男爱上客服机器人的故事。男主想要与客服机器人产生更多互动,就试着教它学习复杂的人类情感,希望客服机器人能爱上自己,实现真正有质量的沟通。
2012 年,在深度学习技术的帮助下,语音识别研究有了极大进展,很多产品开始采用这项技术,如谷歌的语音搜索。这也开启了该领域的变革:之后每一年都会出现进一步提高语音识别质量的新架构,如深度神经网络、循环神经网络、长短期记忆网络、卷积神经网络等等。然而,延迟仍然是重中之重:自动语音助手对请求能够提供快速及时的反应,会让人感觉更有帮助。
AI 科技评论按:在近二十年来,尤其是引入深度学习以后,语音识别取得了一系列重大突破,并一步步走向市场并搭载到消费级产品中。然而在用户体验上,「迟钝」可以算得上这些产品最大的槽点之一,这也意味着语音识别的延迟问题已经成为了该领域研究亟待解决的难点。日前,谷歌推出了基于循环神经网络变换器(RNN-T)的全神经元设备端语音识别器,能够很好地解决目前语音识别所存在的延迟难题。谷歌也将这项成果发布在了官方博客上,AI 科技评论进行编译如下。
Alpha Go战胜李世石成为一个划时代的事件,许多公司大佬纷纷对此表态。不过,留意观察会发现,针对这个事情,BAT都没有表态,最积极的是搜狗王小川和360周鸿祎。搜狗王小川在多家平台担任点评嘉宾,在Alpha Go3:0胜出之后就宣布全体员工放假一天;周鸿祎则发布内部信,对AlphaGo的胜利发表了自己的看法。 首先总结一下老周内部信的主旨思想: 1、充分肯定了AlphaGo战胜人类的长远意义:这次人机大战将开启人工智能时代,会促进深度学习、增强学习、神经网络等技术的普及,而语音识别、图像识别等通用技术
1 新智元推荐1 来源:微软研究院AI头条 【新智元导读】继 9月13日微软将对话语音识别错误率降至6.3%的记录后,前天再次宣布进一步将错误率降至 5.9%,首次达成与专业速记员持平且优于绝大多数人的表现。该成功归功于他们采用了一种神经语言模型,该模型在空间中被表现为连续的向量,计算机能通过该模型得知比如“fast”和“quick”是具有紧密联系的近义词。 一个月前,2016年9月14日,微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率(word error rate
终于有时间更新语音识别系列了,之前的几篇: 语音识别系列︱用python进行音频解析(一) 语音识别系列︱paddlehub的开源语音识别模型测试(二) 语音识别系列︱paddlespeech的开源语音识别模型测试(三)
作者 | 翁嘉颀 编译 | 姗姗 出品 | 人工智能头条(公众号ID:AI_Thinker) 【导读】在人机交互过程中,人通过和计算机系统进行信息交换,信息可以是语音、文本、图像等一种模态或多种模态。对人来说,采用自然语言与机器进行智能对话交互是最自然的交互方式之一,但这条路充满了挑战,如何机器人更好的理解人的语言,从而更明确人的意图?如何给出用户更精准和不反感的回复?都是在人机交互对话过程中最为关注的问题。对话系统作为NLP的一个重要研究领域受到大家越来越多的关注,被应用于多个领域,有着很大的价值。 本期
1月10日,2023微信公开课PRO以直播的形式上线,带来了视频号短视频、直播、直播带货、微信搜一搜、小游戏、微信AI、小程序IoT的新进展,以及这一年在零售、餐饮、出行、酒旅等以及智慧医疗、智慧教育等行业的嘉宾分享,你有没有“在场”见证呢? 2022年视频号原创内容播放量同比提升350%,直播看播规模增长300%; 视频号直播商业潜力持续释放,2022年直播带货销售额同比增长超8倍; 微信搜一搜月活增长至8亿,搜索量同比增长54%; 自2020年以来,小程序在景区、酒店、航空等领域应用广泛,小程序数量增
文艺复兴科技(Renaissance Technologies),全球顶尖的对冲基金公司,创始西蒙斯,执掌全球最赚钱的对冲基金之一。
▊《人工智能:语音识别理解与实践》 俞栋 邓力 俞凯 钱彦旻 著 电子书售价:79.5元 2020年11月出版 本书是全面且深入介绍语音识别及理解相关技术细节的专著。 与我们在2014年出版的《解析深度学习:语音识别实践》相比,《人工智能出版工程 人工智能:语音识别理解与实践》在它的基础上做了大量改写,并对内容有大幅补充,详细总结了新的语音识别算法及应用技术以及在口语对话系统研究中基于深度学习的自然语言处理技术。 本书首先概要介绍语音识别、口语理解和人机对话的基本概念与理论:接着全面深入地依次详述传统声学模
和传统意义上的验证码(CAPTCHA)专治“人机识别”有些不一样,有时我们需要确认用户是否正在持有某个特定的设备(当然也可以顺便做一下人机识别)。 此时,我们通常采用短信验证码来进行这个确认过程。由于
因为客户最希望看到的是直观的成本缩减。 2017年7月9日,由镁客网、振威集团联合主办的“3E‘硬纪元’AI+产业应用创新峰会”在北京国家会议中心盛大开幕。现场200位来自全球AI行业的顶级专家、知名创投机构、创业公司团队和知名媒体齐聚一堂,共谋AI+行业的创新应用,探讨AI的当下与未来。 来自图森未来创始人兼CEO的陈默,在峰会期间进行了主题为《人工智能技术的商业化之路?》的演讲。他表示,人工智能技术的商业化应该优先从B端的服务做起,尤其是替代人力的应用。在企业方面,基于技术或产品辅助所提高的效率是难以估
像这种顶尖赛事,保证音、画质的低延迟本就应该是各大平台的“基本操作”,哪怕一点额外的延迟都是绝对不能忍的。
2015 年,有投资人跟云知声创始人/ CEO 黄伟说:“老黄啊,你要专注赛道,做好语音识别就够了。”
在众多汉字中,同音字(词)是一个特别的存在,正确使用,妙趣横生,使用不当,错误百出。 有网友曾戏谑:再智能的语音识别,遇到同音字(词)都可能“秒变智障”。 有时候,明明是一个温馨感动的时刻,语音识别偏偏剑走偏锋,让你措手不及。 例如: 一下子画风突变。 而语音识别在同音字(词)方面的尴尬还不止于此。 人名“王倩”和“王茜”、小区名“书香苑小区”和“书香院小区”、餐饮词汇“食全食美”和“十全十美”、服装词汇“百衣百顺”和“百依百顺”,乃至日常沟通中的“肌肉”和“鸡肉”、“失忆”和“诗意”、“北麓
随着人工智能产品在生活中的渗透率越来越高,其中技术的发展也成为了众人关心的重点所在。作为人机自然交互的基本途径之一,近期以来,语音识别的发展不可谓不快速。 当下,诸如科大讯飞、百度等多家企业声称,其研发的语音识别技术已经达到了97%的准确率。而在日前,谷歌研究员公开表示其语音识别的错误率(将一个词语从语音转录成为文字时的错误率)自2012年以来已经降低了30%以上……纵观过去的2016年,谷歌、苹果和微软等多家科技巨头都公布了自己在语音识别上的进展和突破,而在接下来的时间里,语音识别也将是2017年的发展重
前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) 📷 音频由公众号“闪电配音”提供 媒体和AI巨头们乐于给大众描绘一幅幅精彩的未来生活蓝图:人工智能可以化身为你的爱车,在沙漠、森林或小巷中风驰电掣;可以是智慧公正的交警,控制红绿灯、缓解交通的拥挤;还可以是给人以贴心照顾的小助理,熟悉你生活中的每一处小怪癖。 在看到这些美妙的畅想之后,作为一个严谨认真的AI产品经理,我不禁想去探索上述美好未来的实现路径;今天,
在近日于上海举办的2016年亚洲消费电子展(CES Asia 2016)上,无人驾驶、智能汽车等相关技术成为最大热点。在CES Asia上,搜狗地图发布了“搜狗智能导航”,最大亮点是可实现车内的全语音交互,而交互并不局限于地图导航本身,几乎可实现驾驶之外的常规车内交互,包括打电话、发短信、查天气、歌曲播放等等。这款产品可运行在智能手机上,还可通过车机互联协议使之运行于汽车屏幕,如果汽车厂商与搜狗进行前装合作则可独立运行于汽车的OS上。基于庞大的POI数据和人工智能技术,搜狗地图在国内首次实现了车内的全语音智
【新智元导读】蚂蚁金服副总裁、首席科学家漆远博士在新智元2017开源·生态AI技术峰会上阐释了 AI 技术在金融场景中的应用和巨大价值。漆远特别强调了场景化对于 AI 技术的意义,并以智能客服、个性化产品和资讯推荐及保险等具体场景为例加以说明。特别地,漆远指出了当前 AI 技术应用中存在的一些挑战,富有借鉴意义。 “蚂蚁金服是一家技术驱动的公司,我们做的事情,是使 AI 技术成为普惠金融的支点。”蚂蚁金服副总裁、首席科学家漆远博士,在有中国“ AI 春节”之称的新智元2017开源·生态AI技术峰会上表示。
以下内容根据 GIF2016 极客公园创新大会年度商业变量论坛 出门问问 Ticwatch创始人&CEO 李志飞的演讲整理而成。 李志飞:过去几年人工智能确实非常热,我作为技术人员和工程师一直保持这个
7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的 2017 中国人工智能大会(CCAI 2
7 月 10 日,Google AI 负责人、「程序员大神」Jeff Dean,以及谷歌几位研究人员在日本东京与人们分享了如何运用 AI 解决当下众多社会问题,包括医疗、环境保护和灾难预防等领域问题的方法。
新浪科技讯 北京时间3月11日上午消息,微软花费了很多时间和资金开发了许多最终有望应用于新产品的技术。例如,该公司在人工智能领域的很多研究都已经应用到Skype Translator的实时语音翻译功能中。但微软研究院院长彼得-李(Peter Lee)最看重的还是量子计算。 这项技术采用量子比特来实现,而没有沿用经典计算机的比特。这些量子比特的叠加可以同时实现大量计算,因而备受期待。 彼得·李接受彭博社采访时说:“量子计算目前的状况令人惊讶。至少在我们微软研究院,这是最大的投资领域,我们感觉即将实现重大的科
第二届网易未来科技峰会在北京悠唐皇冠假日酒店隆重举行。在下午的智能硬件论坛,明势资本创始人黄明明、图灵机器人CEO俞志晨、云迹科技CEO支涛、小鱼儿科技CEO宋晨枫、出门问问CEO李志飞、重创新创始人王冠雄围绕“从家庭服务机器人如何成为大白?”的主题进行了一系列讨论。 对于当前机器人及人工智能领域的现状,俞志晨认为,人工智能目前很多问题都需要解决,还不成熟,创业者需要做的是让这个很难的事情一步步去实现。进一步来讲,”在当前,机器人需要抓的是一些用户的细分需求点,比如小鱼,能把陪伴这种比较小的需求做好,就能解
大数据文摘作品 大数据文摘记者 刘涵 魏子敏 “自然语言技术的未来,其关键点是“自然”两个字。” 11月最后一天,思必驰联合创始人、首席科学家俞凯博士在清华x-lab主办的人工智能研习社第七课上,如此评价自然语言处理,并与现场听众一起畅想了这一潜力巨大的技术将走向哪里。 图:11月30日,思必驰联合创始人俞凯在清华做了题为《认知型口语对话智能》的讲座。 刘涵 摄 在这场题为《认知型口语对话智能》的讲座上,俞凯认为认知交互面临的最主要的挑战一定不是语音,因为从语音识别的角度上来说,问题明确,只要专门向这个领
“吴军、徐鹏、李志飞、陈果果、姚旭晨……这是一个有志青年从约翰霍普金斯大学离开之后,用 AI 改变世界的故事。”
近两年来,人工智能掀起的全民热潮可谓前所未有,几乎每行每业都在积极向机器学习、大数据、深度神经网络等这些“网红”技术靠拢。然而,在人工智能遍地生花的今天,更加令人惊诧的是它在引起追逐狂潮前所经历的寒冬。 9月27日,微软亚洲研究院院长洪小文倾情授课由清华大学发起的《脑科学与人工智能对话:基础与前沿》系列课程第一讲,从寒冬和复兴的双重视角继续为大家剖析人工智能的发展历史。本文是洪小文院长演讲整理稿的第二篇,文章转载自公众号“知识分子”。 谈AI的历史,需要谈谈很有名的AI寒冬。 第一次AI寒冬是在19
《钢铁侠》里的AI管家贾维斯,想必大家都不陌生,这样可以像人一样和自己对话的AI管家,我们是不是都想拥有一个? 贾维斯之所以可以像人一样和我们对话,必然离不开语音识别技术的加持。 如今,从语音输入法到智能家居等,生活中到处都可以通过语音进行人机交互。 拥有一个贾维斯的梦想好像越来越近了! 为了让这个梦想更近一步,学习好语音识别技术势在必行! 今天,博文菌就给大家推荐一本语音识别领域的扛鼎之作——《人工智能:语音识别理解与实践(精装版)》,该书被列入“国家出版基金支持项目”,并入选为《人工智能出版工程》系列丛
演讲嘉宾:朱频频,小 i 机器人创始人、CEO 【新智元导读】定位于做一家要赚钱的人工智能创业公司,成立16的小i机器人(智臻智能)预计今年实现盈利,计划明年上市。相比酷炫的自动驾驶,智能客户机器人已经深入产业,深入生活。在Gartner发布的“2017十大战略技术趋势”中,小i机器人与微软的Cortana、苹果Siri和亚马逊的Echo一起,被当作物联网时代人机沟通新型界面“Conversational+”的范例。新智元AI WORLD2017 世界人工智能大会,小i机器人创始人、CEO朱频频发表题为《会
这背后所利用的技术就是人工智能中很重要的神经网络与机器学习,神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。利用分层的神经元,从大量样本数据中总结出共同特征,由此生成高还原度的合成声音。
本文介绍了语音识别技术中的端到端模型、基于CTC的序列模型、基于序列学习的注意力机制模型、基于3D卷积神经网络的语音识别系统等。其中,端到端模型可以直接从原始音频数据中学习到针对语音识别的抽象表示,具有较好的可扩展性和鲁棒性;而基于CTC的序列模型则通过连接主义学习的方法,将CTC定义的序列映射问题转化为神经网络中的参数优化问题,进一步提高了语音识别的准确率;基于序列学习的注意力机制模型则借鉴了语言学中的注意力机制,通过对输入序列进行加权处理,进一步提高了模型的识别准确率;基于3D卷积神经网络的语音识别系统则利用3D卷积核对输入序列进行卷积处理,提取出序列中的特征信息,进一步提高了模型的识别准确率。
今年四月,伊利诺伊州麦当劳的一位顾客对麦当劳提起诉讼,称该公司在使用语音识别点餐之前没有事先获得批准,违反了州生物信息隐私法案。
作为人工智能领域的一个重要方向,语音识别近年来在深度学习(Deep Learning)的推动下取得了重大的突破,为人机语音交互应用的开发奠定了技术基础。语音识别技术演进及实现方法、效果,既是语音识别从业者需要系统掌握的知识,也是智能化应用开发者应当了解的内容。日前,微软研究院首席研究员、《解析深度学习-语音识别实践》第一作者俞栋接受CSDN专访,深入解析了基于深度学习的语音识别的最新技术方向,和微软团队的实践心得,并对微软开源的深度学习工具CNTK的迭代思路做了介绍。 俞栋介绍了deep CNN、LFMMI
然而,创业并非易事。更重要的是,他们选择以一项在当时不被看好的技术——语音合成起家。
【新智元导读】2016年12月18日,新智元百人峰会闭门论坛在微软亚洲研究院举行。云知声CEO黄伟在会上带来了《构建AI生态,技术和商业应该是一个良性循环 》的分享。黄伟认为:人工智能领域里面虽然BAT很重视AI,而且有了很强的人才团队,但是跟行业结合恰恰是BAT很难做到的,因为他们在上面。AI和IoT是新的一波机会。 以下是黄伟演讲实录。 大家下午好!今天前面杨总(新智元杨静)说了雾霾天出来做这样的交流其实都是真爱,前面二位老总介绍的一些微软包括海尔做的事情,我非常高兴的一点是,我们选择的方向都是对的,都
2020年提供良好客户服务体验的基本原则将与2019年大致相同:客户将期待便捷的渠道解决方案,而这些解决方案几乎不需要他们付出任何努力。然而,随着面向客户服务的无摩擦、异步和个性化的私人消息传递渠道的兴起,品牌的联系中心必须相应地进行调整。
腾讯发布2022第4季度和全年业绩报告:第4季度收入1450亿元,全年营收5546亿元。
2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了“解读2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。 2015年,借助移动互联网技术、机器学习领域深度学习技术的发展,以及大数据语料的积累,自然语言处理(Natural Language Processing,简称NLP)技术发生了突飞猛进的变化。越来越多的科技巨头开始看到了这块潜在的“大蛋糕”中蕴藏的价值,通过招兵买马、合作、并购的方式、拓展自己在自然语言处理研究领域的业务
领取专属 10元无门槛券
手把手带您无忧上云