最近在做一个文本转语音TTS(Text to Speech)的第三方软件封装,使用的是国内语音技术龙头安徽科大讯飞公司提供的离线引擎AiSound5.0,主要用于汽车导航用途。科大讯飞还提供了AiTalk用于语音识别,AiWrite用于手写识别服务等。另外还有针对6种平台的SDK和开发示例。
文章不是简单的的Ctrl C与V,而是一个字一个标点符号慢慢写出来的。我认为这才是是对读者的负责,本教程由技术爱好者成笑笑(博客:http://www.chengxiaoxiao.com/)写作完成。如有转载,请声明出处。
中国语音巨头科大讯飞2014年8月20日在北京召开规模宏大的发布会,展示语音技术最新成果、发布科大讯飞一揽子软硬件产品、启动讯飞超级大脑计划、宣布科大讯飞1亿元创业基金,并对表现突出的讯飞开发者进行了表彰,以鼓励更多开发者进入讯飞生态。科大讯飞董事长刘庆峰在会上做了近两个小时的演讲,并进行了大量的现场演示,为了演示智能语音车载系统,甚至不惜耗费巨资将一辆MPV轿车从场外吊入位于国际会议中心4层的场馆。台上还有一个模拟智能客厅,核心家电一应俱全。这场发布会耗资不少,一定程度表明科大讯飞高调拥抱智能硬件大潮的
在位于合肥规划中三到四平方公里的中国语音产业园,建筑机械群正在紧张作业。在竣工的讯飞大厦里,两千多名科大讯飞员工围绕“声音”忙碌着。在移动互联网的风口,兼具软件和互联网公司特征的讯飞,站在了2B和2C市场的十字路口,前途看上去机会重重但又充满凶险。 近期,受科大讯飞邀请,笔者与一些媒体人前往合肥,对讯飞的技术、处境,以及讯飞怎么看待语音市场的竞争态势与格局,做了采访与了解。 一、移动语音市场要爆发了!是真的吗? 今年是中国语音市场最热闹的一年。创业新秀云知声刚获得1500万美元投
然而,创业并非易事。更重要的是,他们选择以一项在当时不被看好的技术——语音合成起家。
随着数字化时代的来临,国内各企业为了提升行业竞争力,纷纷开始利用数字化技术,来实现以降本增效为核心的数字化转型,得益于此,助力企业数字化转型升级的SaaS也开始进一步升温。
李根 假装发自 金寨路96号 量子位 报道 | 公众号 QbitAI 📷 △ 科大讯飞08年上市以来股价走势 桃李春风一杯酒,江湖夜雨十年灯。 18年筚路蓝缕后,科大讯飞正在迎来(史上)最好的资本市场时光。 截至8月18日收盘,这家深交所代码“002230”的安徽合肥企业,每股股价60元,市值高达833.22亿,而且看起来所受的期待和期望,还要更高。 这一切皆拜人工智能所赐,自AlphaGo摧枯拉朽般把AI概念普及至千家万户后,外界开始意识到主打语音技术的讯飞,竟是一家几乎被遗忘
“中国语音识别技术的突破,将带动着场景下的语音交互更加智能化、实用化,更在未来十年带动万物互联的整体布局与发展,赋能人工智能的黄金新十年。”
新智元推荐 来源:科大讯飞、华为 编辑:克雷格 【新智元导读】最近,科大讯飞与华为签署战略合作协议,双方在B端和C端市场同时发力,在公有云服务、ICT基础设施产品、智能终端以及办公四大领域深度合作
如今,语音已经成为万物互联时代人机交互的关键入口,在智能家居、智能汽车、穿戴式设备等场景不可或缺。我们看到的各类便捷的智能语音应用,背后是语音识别、语义理解、语音合成等技术的创新发展。全球化背景下,AI 多语种智能语言技术在各行各业的应用越来越广泛。 科大讯飞作为智能语音行业的执牛耳者,在多语种智能语言技术上不断进行技术创新和应用落地实践,迎接市场环境变化下的新挑战。7 月 15 日,科大讯飞在武汉的“讯飞乐享 A.I. 技术沙龙”专场,面向开发者,对科大讯飞在 AI+ 多语种智能语言技术上的研发、实践、求
6 月 23 日,讯飞开放平台乐享 A.I. 技术沙龙“A.I. 虚拟人多模态创新交互”专场在成都圆满落幕。 35 秒带你回顾现场精彩瞬间↓↓↓ 近几年,随着图像处理、语音合成、语音识别、语义理解、多语种等多项人工智能技术不断发展,AI 虚拟人开始在各行各业落地应用,各大公司争相布局。这背后,其实是 AI 虚拟人多模态交互技术正在成为大趋势。 多模态融合视觉、听觉、文本等多种模态信息,能够打破单模态输入输出限制,从而更贴近人类真实使用习惯。对于 AI 交互产品来说,只有综合利用多模态信息才能更准确地理解人类
李根 假装发自 凹非寺 量子位 报道 | 公众号 QbitAI 一年一度,科大讯飞总会通过年终发布会,披露一年成绩,发布最新战略。 与去往年不同,自AlphaGo在2016年横空出世之后,人工智能狂飙突进,以语音起家的科大讯飞,也成了A股市场最受关注的人工智能公司。 即便伴随一些营收、盈利方面的争议,但讯飞年度发布会,依然是各方关注焦点,讯飞甚至国内AI趋势,也可以在此窥见一二,特别是来自资本市场的直接反馈。 比如去年年度发布会至今年,讯飞股价已从30.6元,上涨至60.10元,涨幅96%,其间最高涨幅一
“2024年上半年对标GPT-4”,这是23年科大讯飞全球1024开发者节现场给出的承诺。
---- 新智元报道 编辑:Q 【新智元导读】1024开发者节大会上,讯飞听见发布「智慧办公服务平台」,让办公不止于「听见」。 智能语音,一直被认为是人工智能时代各种终端的「入口」,长期以来都是各大公司的「必争之地」。 在刚刚过去的1024开发者节上,科大讯飞向我们展示了虚拟人交互,多模态等多种前沿技术的落地应用,更是将400多项能力开放给数百万开发者使用,其中就包括多项科大讯飞深耕多年的智能语音技术。 在大会的现场,讯飞听见同传为大会提供了实时语音转写翻译服务,为远程观看的观众提供更贴心的双
今天,智能语音助理融入我们生活之中已经很久,赋能各个行业已经成为了社会的共识。当电子地图可定制的语音包上线,实现了通过极其简单的流程就可以完成复杂的工作,人工智能时代离我们越来越近的感受,也愈发真切了起来。
就在上周,央视《东方时空》栏目曝光了科大讯飞非法侵占安徽扬子鳄国家级自然保护区,以建设培训基地为名开发房产一事。一时间,舆论的讨伐,风起云涌。
随着技术的升级、消费者需求的爆发以及大环境的变好,智能语音行业的发展愈发如火如荼,智能语音也在悄无声息地渗透进人们的日常生活。以输入方式为例,语音输入已经超越拼音输入和手写输入,成为当下主流输入方式。
科大讯飞一直在智能语音与人工智能核心技术上代表国际先进水平,在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等领域一直“代言”黑科技。尽管创新能力已经从语音扩展到影像领域,人们对科大讯飞最深刻的印象一直围绕语音。
5月4日,有着最难语音识别任务之称的CHiME-6成绩揭晓:科大讯飞联合中科大语音及语言信息处理国家工程实验室(USTC-NELSLIP)在给定说话人边界的多通道语音识别两个参赛任务上夺冠。
“整天都在说人工智能,可人工智能到底在哪里呢,为什么到了2022年,自动倒车入库的功能都没普及,导致科目二考试还是那么难。”除了文字上的抱怨,还特意加了张某自动驾驶企业的宣传图。
锤子M1手机发布会结束之后,M1系列手机能否在诸多强敌面前成功突围眼下还不明朗,然而,多次被老罗推介的输入法,讯飞输入法却意外地火了起来却是事实。 在发布会之后的几天,这款输入法甚至成功登顶了AppS
杨净 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 20年前,安徽合肥一群来自中科大的探路者押注AI,成立科大讯飞。现在合肥被称为中国“最敢赌”、最牛的风险投资机构。 10年前,科大讯飞人工智能开放平台发布。 现在这个平台上的开发者,从十几个团队,成长到超过150万家;应用终端数从不到10万,增长到超过20亿;而这个平台能提供的能力,从当年的语音合成和识别两个,大幅提升到如今的334种复杂AI技能。 在讯飞之上已经成长出一套成熟的生态系统。今天,已经创下史上最佳业绩的科大讯飞,要向着新十年
科技对于生活而言究竟扮演的是什么角色?在科技至上者的眼中,科技是生活、社会进步的唯一钥匙,是人类长河之中向着灯塔进发的唯一燃料。而在对立者的眼中,科技的发展会迎来一个弗兰肯斯坦式的怪物,那将会是人类生活的自我终结。
你或许会说,语音识别和机器翻译——没错,传统的语音翻译通常采用语音识别和机器翻译级联的方式实现,对输入语音先进行语音识别得到文本结果,然后再基于文本进行机器翻译,这也是当前语音翻译采用的主流方法。
机器之心报道 作者:蛋酱 又是一年 1024 ,对于全球开发者来说相当特殊的一天。 1024 这一天,无论你身处何方,都能感受到浓浓的节日氛围。但说到场面最宏大、参会人数最多、内容最丰富的 1024 活动,还是要来合肥看看这家老牌 AI 企业的玩法。 10 月 23 日上午,2020 科大讯飞全球 1024 开发者节在合肥开幕。作为科大讯飞举办的第四届 1024 开发者节,今天的大会比往年来得都早了一些。 「创业的过程就像是登山,我们只有胸怀登顶的梦想,一步一个脚印,踏踏实实地积累高度,最后才能登顶。而
---- 新智元报道 编辑:Emil、小匀 【新智元导读】数据稀缺以及开发成本高,多语种识别和翻译被认为是机器翻译技术难以跨越的难题。但随着国际交流日益频繁,跨地域、跨文化间的无障碍沟通成为不断增长的刚性需求。近期科大讯飞表示,通过系统性创新,他们将在10年内让机器在70+语言之间实现互通。 下一个十年,人工智能会从「黑盒」变「白盒」吗? 下一个十年,人机共存时代会真正到来吗? 下一个十年,哪个学科又会与人工智能深入交叉,引发颠覆式的革新呢? 人工智能核心技术的逐渐成熟推动智能产品的落地,以语
这是“AI国家队”科大讯飞正在探索的新路。与互联网不同,在人工智能领域中,To C业务反而未经大范围开拓。
在2019新品发布会上,这家成立20年的AI公司,一口气发布5款硬件,并对其核心的语音操作系统进行了升级。
今天是1024程序员日,也是科大讯飞的1024开发者节,在合肥奥体中心,科大讯飞把它们的开发者节办成了演唱会的形式。
作者介绍:杨剑勇 传感物联网创建人、物联网资深人士、百强科技名人,著有多篇文章被上千媒体转载,著有《物联网为何萎靡不振:不接地气》、《可穿戴设备出路:设计与科技如何完美融合》,长期关注物联网、人工智能
近日,科大讯飞公布业绩快报显示,2019年全年实现营业收入100.89亿元,同比增长27.43%;实现归母净利润7.88亿元,同比增长45.46%。但是,科大讯飞净利润依靠政府补贴“撑门面”的老问题依然存在,2019年这一比例高达50.3%。另一方面,科大讯飞2018年开启的国际化业务也经营惨淡,破局艰难。2019年科大讯飞国外地区营收仅为0.83亿元,占比只有微弱的0.82%。
科大讯飞将于本月20日在北京国家会议中心举行以“语音点亮生活”为主题的发布会,发布面向智能家庭硬件的新一代语音云平台。 在苹果、微软和谷歌等国外巨头纷纷试水智能家居领域的今天,通过语音控制整个智能家居生态系统已成为可能。作为研制智能语音软件起步的科大讯飞,也渐渐地走上软硬件一体化的发展道路。 据雷科技独家获得的最新线报,除了发布面向智能家庭硬件的新一代智能语音技术之外,科大讯飞还将发布的智能语音硬件其实是一款Wi-Fi智能音箱。我们也得到了一张据称是这款智能音箱的泄密图。从图中我们可以看到,方方正正的机身
今天(10月25日)一早,百度语音技术负责人贾磊在新浪微博上发出这条消息: 感谢各位语音界的朋友支持我们,开放初期,招呼不周还请多多谅解,2~3周之后,语音识别错误率还会降低1/5,嵌入式连续语音识别,语音合成等技术等都会陆续开放。百度语音部门不单单做产品,拥有语音识别和语音合成的技术提升能力才是我们的长久的核心竞争力。欢迎大家选择百度,和我们一起成长。 贾磊并非微博活跃份子,上条信息是9月15日。由此看来,这条微博似有故意对外界放风之意。 笔者稍后向百度方面打听到,李彦宏今天凌
近年来,随着国家“书香型社会”建设政策的出台,公众的阅读需求正在逐年增加,各类读书产品和读书活动,也如同雨后春笋般涌现,人们的阅读体验日益得到丰富。比如,昨天世界读书日举行的“不如大声读书”活动,就通过线上直播与线下共读的方式,让读者们以书会友沟通交流、彼此链接,帮助人们在日益碎片化、快节奏的生活之外,找到内心的安住。
明敏 整理自 凹非寺 量子位 | 公众号 QbitAI ChatGPT掀起AIGC浪潮后,关于它的影响,成为了行业内外最为热议的话题之一。 宏观的观点已不胜枚举:改变世界、AI的iPhone时刻…… 但如果回归到技术本质,它到底会带来哪些变革? 我们认为,它会改变信息分发获取的模式。革新内容生产模式,变革人机交互模式,同时也会促进多个产业的升级。 这是科大讯飞AI研究院常务副院长高建清,在首届中国AIGC产业峰会上给出的答案。 作为国产AI的中坚力量,在这股最新趋势下,科大讯飞始终被寄予厚望。 尤其在2月
雷锋网AI掘金志消息,12月30日,招商局中国基金宣布,公司的全资附属公司—深圳天正签订了日期为2019年12月27日并关于安徽科大讯飞医疗信息技术有限公司("讯飞医疗")的股权转让协议。
【新智元导读】科大讯飞2017年度发布会今天举行,科大讯飞董事长刘庆峰带来公司最新技术动态介绍:过去一年,讯飞在无监督学习和医疗上的突破成为亮点。科大讯飞执行总裁胡郁带来一系列重磅产品更新:全新的 AIUI 2.0平台、翻译机、输入法、车载系统等等,并且展示了让人兴奋的黑科技——脑电波控制智能家电。科大讯飞轮值总裁吴晓如发布公司在教育、客服和医疗三大方向10个重量级产品。本文带来最全盘点。 科大讯飞一年一度的发布会9日在北京国家会议中心举行,科大讯飞董事长刘庆峰、科大讯飞轮值总裁吴晓如、科大讯飞执行总裁胡郁
在移动互联网汹涌澎湃的十余年时间里,第三方输入法可以说是见证历史的史诗级产品:经历了智能手机普及初期的高速增长,经历了消费人群迭代的习惯变迁,经历了用户增长趋缓的多元探索,并且正在经历人工智能浪潮对输入法的新一轮重塑。
大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民币。而在刚刚过去的长假中,“云知声”也高调宣布获得金额为千万美金折合约1亿元人民币A轮融资。虽然其体量尚无法和科大相比,但这对沉寂一年的语音识别市场却是重大利好。 而同样涉足该领域的百度、腾讯、搜狗也正在加快技术迭代的脚步,作为战略级标配,语音技术在巨头眼中都格外重要。与国外巨头占领语音市场相似,业内普遍认为,受技术门槛的限制,语音市场创业窗口或已
近日,讯飞输入法新版本正式上线,在随声译和快捷翻译功能里增加了日译中、韩译中、泰、越、西、法、德、俄与中文互译,合计18种翻译,这也使得讯飞输入法成为中文与外语互译最多的输入法产品。
作者简介:毕啸南,知名青年学者,量子位专栏作家,《中国AI领袖人物访谈》系列制片人、主持人。点击文末阅读原文,关注量子学园的毕啸南专栏,跟随他一起持续深度对话李开复、周鸿祎、王小川、王海峰、胡郁等众多
【新智元导读】作为中国人工智能产业的标杆企业,科大讯飞2016年度发布会受到业界高度瞩目。11月23日北京国家会议中心,科大讯飞携产业链合作伙伴的人工智能+黑科技澎湃而来。A.I.+万物互联输入法、A.I.+教育、A.I.+翻译、A.I.+司法….. 人工智能+生态系统越来越强大,讯飞植根产业链的深厚积累迎来爆发。科大讯飞董事长刘庆峰在会上强调,正在经历第三次热潮的人工智能并不是概念泡沫,而确实可以运用到所有这些行业中。科大讯飞一年来再次挑战AI巅峰,在被称为“代替图灵测试”的Winograd 挑战赛中摘得
AI 科技评论消息,中国科学技术大学硕士和学士李世鹏、美国里海 (Lehigh) 大学博士,日前出任讯飞 AI 研究院联席院长。
作为人工智能第一股,在技术研发方面,科大讯飞一直走在前沿,尤其讯飞语音一直是这家公司的王牌业务。
【新智元导读】国际知名市场研究公司Research and Markets 2016年5月4日发布报告《全球及中国语音产业报告,2015-2020》的修订版本。报告认为,随着语音在智能产业的应用不断加深,全球,以及中国的语音市场在接下来的5年当中仍将维持显著地增长,到2020年,全球语音市场规模预计将达到191.7亿美元。报告数据显示,尽管领头羊Nuance仍然占据着三成的市场份额,但是已经出现明显下滑趋势,其他科技巨头谷歌、微软、苹果和科大讯飞则获得了迅速的增长,全球市场份额分别为20.7%、13.4%、
无论我们在闪烁的电脑屏幕前工作,也不管如何完成某种创造性的任务,还是被动地从事日常活动,都要求有效地从意识中取消或排除大量来自当下环境的东西。
最近刚换了三星的Note9,深度体验了一下Bixby的语音功能,觉得挺不错的,而且上周的人工智能大会上,分布屏幕两边的分别是科大讯飞和腾讯提供的服务:讯飞听见和腾讯同传。两者的表现也都是让人眼前一亮。
语音识别功能已经是一个很普及的功能,在特定情境下,能带给人们方便的交互的体验,比如驾驶时使用语音进行唤醒手机,各类智能音响产品,语音控制智能电视等。本文主要介绍在APICloud平台使用科大讯飞的SDK快速实现语音识别功能。
一个现象:生活中越来越多人摒弃拼音输入功能,转而使用语音输入功能,微信、QQ等社交软件语音功能已十分成熟,百度搜索、搜狗搜索等也都添上语音输入功能,语音输入取代拼音输入的劲头显现。
领取专属 10元无门槛券
手把手带您无忧上云