首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

让他们听见世界:用多模态预训练模型,铺设数字化“盲道”

在普通人直观想象中,以视觉信息和触控交互为核心的智能手机与视障人群之间,必然有着巨大的鸿沟。 但现实并非如此,假如你真的接触过视障群体、去尝试过盲人按摩,你会发现他们同样依赖智能手机:从接听电话到发送消息,从拍照到导航,在手机厂商和软件公司的努力下,这些文字性的内容基本都能够顺利地被读出来,传递给视障用户。 真正的难点是文字之外的图像,手机本身的界面、各种APP中的图像内容很多都没有文字备注、更不具备视障功能。如果在微信跟别人聊天的时候不小心收到一张图,视障群体只能回到求助他人的老解决路线之上。 如果能让

02

数据万象音视频处理 —— 打开对声音的想象,开启AI创作时代

“前方路口请直行”、“限速100”、“前方路段拥堵”等,是不是看到这些导航常用语句,脑海中已经有您常听的声音浮现了?导航播报所使用的TTS语音合成技术的商业化道路从有声听书、银行智能客服覆盖到虚拟人配音、残障人士辅助应用等,用户需求来源多样,应用场景逐步细化和专业,在这众多的行业所孕育出的应用场景中,TTS语音合成技术大幅减少文字转为语音的时间与企业用工成本的同时,也为用户带来由AI创作赋予的全新体验,语音合成模型经过长时间的发展,由最初的基于拼接合成,到参数合成,逐渐达到了感情充沛、高流畅度、个性化的现阶

01

揭秘奥运赛场上的语音技术 | AICon

运动员在不断打破记录的同时,其实离不开新科技的助力。印象最深的是游泳运动员身穿的仿生鲨鱼皮泳衣,在游泳的过程中,可以让水流更加顺畅的从运动员身体的各个部位划过。 除此之外,今年东奥会上也出来现了很多新科技应用场景,有点像科技“秀场”。 这里选取语音技术来展开,例如科大讯飞在开放创新平台基础上,建成了一套具有奥运特征的多语种智能语音和语言关键技术服务平台,为中国奥运代表团提供了“语音转写”和“机器翻译”两项技术类别的支持,方便大家在会场上和不同国家的运动员交流,也便于识别不同语言文字的意思。 另外,像语音合

02

产品上新 | 云直播实时监播,为重要直播保驾护航

随着各类直播产品的火爆应用,直播过程的稳定性越来越受到大家的关注。腾讯云直播新研发的实时监播产品,正是在这样的客户诉求下应运而生,解决大家对重要直播活动进行智能监测及自动报警的需求。 实时监播应用场景 重大体育赛事活动:像世界杯这样的体育赛事,大量观众无法到现场参与活动,会通过线上直播在世界各地同步观看赛事画面。这样的大型赛事直播并发高、机位多、情景复杂,为了保证直播顺利进行,赛事方需要在过程中对直播情况进行密切监控。实时监播功能可以直观呈现直播画面及码率、帧率等参数,并智能监测异常情况,第一时间发现断流、

00
领券