首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机遇与挑战并存 思必驰“两手抓”闯关发展新路径

根据Gartner预测,到2025年,各行业的AI/ML(机器学习)渗透率将会达到70%以上,AI软件行业增长率也将达31%。未来十年,人工智能将进入大规模商业落地阶段几乎已在业内达成共识。

毫无疑问,这十年间,行业竞争将异常激烈,业内企业将在实践中集体迎来了AI规模化落地与持续经营的关键挑战。对于如何打好这场突围战,思必驰给出了一个新的解决思路,通过“终端+AI”“行业+AI”等方式深度赋能各行业场景,促进诸多应用落地。

自成立以来,思必驰便深谙“技术为王,创新为本”的重要性,不断加码研发投入。多年的技术沉淀,如今的思必驰拥有全链路的智能语音语言技术,自主研发了新一代人机交互平台(DUI)和人工智能芯片(TH1520);为车联网、IoT及政务、金融等众多行业场景合作伙伴提供自然语言交互解决方案。

在2022年,思必驰发展势头不减,技术研发不断突破自我。

发音人音色定制平台

2022年3月,思必驰推出易操作的发音人音色定制平台。该平台是思必驰提供的一项进行音色定制训练的平台服务,旨在赋能用户自主完成语音合成音色模型定制,降低语音合成定制门槛。使用者只需要根据自身场景需要,上传一定量符合规定标准的音频,即可一站式完成自动标注、模型定制、质量评测。

目前,该平台支持定制中英文、成人男女、儿童等类别,以及幽默、严肃、甜美、中性等各种情感风格的音色,可以满足客户在消费电子产品、明星动漫热门IP、数字人客服、有声读物、新闻播报等多个领域的应用需求。

DUI标注训练一体化平台2.0

为帮助企业在智能化转型中,拥有更高的技术自主性,思必驰曾推出DUI标注训练一体化平台,通过平台化的方式开放智能语音算法能力,赋能不同类行业/企业在使用语音服务中,拥有数据标注、模型训练能力,持续提升场景识别效果。目前平台提供语音技术定制化服务,在会议、航空通讯、医疗、城市交通、门店质检等垂直场景里运用。用以提升企业服务、管理效率。

而经过一年的使用实践,目前平台也迎来了2.0的版本升级。升级后,公有云版正式开放,同时推出便携一体机版本,拥有更强的扩展性,随用随调,使用更便捷。更低的平台使用门槛,减轻研发人员投入。升级后的平台支持公有云、私有云、便携一体机等多种灵活的接入形式,服务均可定制化。

直面唤醒 处处皆是“C位”

针对在全屋智能一体化家居场景或卖场场景下多设备的情况,思必驰新推出“直面唤醒”方案,人站在不同位置,设备可以通过模拟人耳的算法模型可以帮助用户优先唤醒其中某一个设备,避免几个设备同时被唤醒,判断更精准、更符合用户的交互习惯。该方案也入选了长三角2021年度人工智能产业“十大科技事件”。

DUI平台上线“单人千音”

12月份,思必驰DUI平台上线“单人千音”功能。“单人千音”通过深度神经网络对发音人音色进行建模,实现单个音色就能生成同时覆盖多种语言、多种风格的语音合成声音,极大丰富了合成语音的表现力。

目前,单人千音可满足智能车载、AI客服、视频配音、智能家居等场景下的使用。

众多创新技术的落地转化,需要市场的土壤。7月15日,思必驰正式向科创板发起冲刺,拟募集资金10.33亿元,用于推进产品迭代和技术创新。招股书显示,思必驰营收从2019年的1.15亿增长至2021年的3.07亿,营收逐年提升。

在过去的数年中,中国AI语音的需求逐渐爆发。未来,在产品供应商和开发者共同构建产业生态圈的过程中,语音识别技术将更好地与其他语音交互技术及软件功能融合,AI语音识别市场将迎来广阔的发展空间。依托“终端+AI”“行业+AI”两手抓的发展模式,思必驰将在竞争激烈的市场中披荆斩棘,创新技术、开拓场景、稳中求进,持续上行发展。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230131A03VOB00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券