专栏首页BestSDK一周简报|时代拓灵推出VR“全景声”SDK,可应用到硬件、平台、软件等

一周简报|时代拓灵推出VR“全景声”SDK,可应用到硬件、平台、软件等

编辑导语

时代拓灵推出VR“全景声”SDK,可应用到硬件、平台、软件等;东软发布RealSight高级分析应用平台,帮助企业实现智能化运营;

智齿客服助力现金巴士,提升客服效率深度服务P2P市场;Testin发布2.0,提供一站式APP服务平台;智能语音识别专家捷通华声,出席2016中国语音产业年会

时代拓灵推出VR“全景声”SDK,可应用到硬件、平台、软件等

VR内容体验中50%靠声音

影视行内有句话,“没声音再好的戏也出不来”。而在全景视频当中,声音的作用则显得更为重要。根据传统经验,正常观影之下70%左右的体验靠的是视觉,30%靠声音。而在VR视频的体验中,50%都要依靠声音。因为在360度这样接近现实的立体全景环境中,人们非常依赖声音的空间定位感,这是人类对于声音的“自然本性”所致。

“全景声可再现引人入胜的多维声音,实现声场包围,展现更多声音细节,提升观看视频者的感受,打造即便在家里也能体验得到的身临其境的感受。”时代拓灵创始人兼CEO孙博士介绍,“譬如如果你在VR游戏中启用全景声,你将可以精准的定位刚刚从你头顶上飞过的飞机或者躲在暗处的狙击手。它的基本目标就是要让声音成为你的武器。”

为了进一步降低VR全景声制作的门槛,推动整个行业的发展,时代拓灵正式推出免费版本的VR全景声引擎“TwirlingVRAudioSDK”,为合作伙伴提供高标准的耳机和扬声器三维全景声解决方案,从而实现沉浸式的全景声效果。

高效算法精准还原虚拟声源

与立体声被动式的接收不同,VR全景声需要满足观众头部旋转时实时调整声音角度的需要,最大程度的创造沉浸式的体验。实现这样理想的效果,无论从数据采集、数据处理上都是难度很大、要求很高的。

孙博士介绍,“TwirlingVRAudioSDK”利用自主知识产权的全景声场算法,精确还原全景声场中所有声源的位置、方向、距离和运动轨迹等重要信息。针对移动VR和一体机对低功耗的要求,从一开始设计拓灵就把效率放在很重要的位置。得益于高效的架构,在处理复杂场景上TwirlingVRAudioSDK的效率上大大高于类似产品。理论上可以同时提供128轨的音频,不错过任何声音细节,并根据陀螺仪给出的头部旋转和位置等信息,随时加入音源,并实时渲染。”SDK支持头部旋转和移动下的声场重建,利用头部运动的信息,实时调整声场方向,位置和距离,使用户仿佛置身于实际环境之中,感受不到耳机的存在。

成熟商业解决方案

据了解,“TwirlingVRAudioSDK”开发包的核心主要由动态链接库组成,提供的API接口可以帮助开发者很容易集成到各类应用,产品或系统里。另外SDK开发包里还包含必要的文档,代码示例和Demo,帮助开发者很快上手。“TwirlingVRAudioSDK”支持多种VR360声场录音的渲染,如Ambisonic和人头录音,后期制作分轨音源,同时支持将传统立体声转变成适合VR声音播放的声音格式。除了耳机模式,该款SDK还提供扬声器模式,用户通过一对扬声器也可以体验全景声的效果。

更为便捷的是,时代拓灵VR全景声引擎实现了跨平台,提供各个平台下的SDK,可以灵活的用于Android,iOS,Windows,MacOS以及Unity3D平台。使用者或开发者只需要根据API的程序参数,提供声源的音频数据,声源位置信息和头部运动信息,引擎就能实时计算返回耳机输出的音频数据。

东软发布RealSight高级分析应用平台,帮助企业实现智能化运营

近日,东软集团在京发布RealSight(睿见)大数据高级分析应用平台,帮助企业实现智能化运营,让大数据成为企业创新和转型的重要支撑。RealSight是建立在SaCa与UniEAP数据汇集、高级分析与展现产品组合基础上的企业级大数据高级分析应用平台产品,围绕客户智能、IoT(物联网)智能与运营智能领域,将大数据高级分析技术、业务数据与领域知识深度融合,形成系列应用产品组合,通过更精准的客户洞察和运营优化,帮助客户吸引和保留用户、识别异常行为、降低运营成本、善政惠民。

东软RealSight平台的客户智能、物联网(IoT)智能与运营智能三大系列产品组合能够提供融合人、业务和物的高级数据分析服务,有效驱动企业更精准的客户洞察和运营优化。

客户智能(ReslSightCI)包括行为分析、精准营销、个性化推荐等子产品平台,为企业提供数字营销解决方案,帮助企业更好地发现客户、了解客户和保留客户;

物联网智能(ReslSightII)在实时数据采集的基础上,能够对软硬件设备运行环境进行全方位的综合监控分析、预测性维护和优化改进;

运营智能(ReslSightAPM)则是为企业提供应用体验分析、应用性能保障、潜在风险规避等应用性能管理和风险管控解决方案。

东软集团平台产品事业本部先行产品研发事业部总经理赵立军对此表示,传统BI商业智能应用经过了描述性分析阶段和诊断型分析阶段,主要是对历史数据进行统计分析,描述过去发生了什么,通过对历史数据进行数据挖掘,生成报表,发现原因。

智齿客服助力现金巴士,提升客服效率深度服务P2P市场

主打“微额速达”的现金巴士以其方便快捷、借款周期短等特点,产品一上线就面临大量的服务请求。互联网金融的客服,更多的扮演着服务驱动的角色:客服工作贯穿整个售前服务、售中体验、售后评价的全过程。目前,在强服务重沟通的互联网金融行业,云客服的应用已经非常广泛。此次,现金巴士选择与智齿客服合作,采用了机器人客服+人工客服+工单客服协作的智能客服系统,以缓解客户服务压力、节约企业成本、提高客服工作效率。

为了快速解决现金巴士目前服务渠道和体系不完善的问题,从确定项目到正式上线,仅三天就完成了现金巴士的多渠道统一管理快速部署,覆盖现金巴士的网站,微信公众号,APP。同时7*24全时在线的机器人能随时随地与客户沟通,解决了人工无法全时覆盖的问题。

现金巴士的产品设计以及违约催收等各个运营环节,一直贯穿着“让客户有尊严地解决紧急借款需求”的用户理念。但同时产品的门槛就在于--如何快速判断借款人的还款能力和意愿,提供无抵押的借款。因此,“及时”和“专业准确”是现金巴士对服务的首位需求。

智齿客服的机器人和人工任意切换的产品模式,有效的解决了及时响应的问题。同时,准确率高达97%的机器人通过精准的理解答复,过滤常规性问题咨询,并通过智齿智能学习体系能够帮助快速扩充知识库,能够更加及时准确的帮助现金巴士有效控制风险。

此外,考虑到金融领域的安全性需求,智齿客服从应用安全、部署安全、底层安全等几个维度保证了系统等稳定性和安全性。目前,智齿客服已经服务了诸如宜信、翼龙贷、京北金融、紫马财行,以及量化派等互联网金融行业的领军企业,具备丰富的行业服务经验。

Testin发布2.0,提供一站式APP服务平台

Testin发布2.0测试服务,主打移动APP一站式云测试服务平台、Testin一站式缺陷智能解决平台,具体来说就是满足所有APP的测试需求,一站式管理APP质量。

在大型软件开发过程中,测试工作需要耗费大量的时间与成本,而测试手段完全采用手工测试,测试的效率与准确性都非常低。而在大多数情况下,软件测试自动化则可以减少开支,增加有限时间内可执行的测试,在执行相同数量测试时节约测试时间。Testin云测创始人CEO王军的愿景就是希望让天下没有难做的APP。

Testin云测作为世界上首家推出基于真机测试实验室及自动化测试技术的移动应用“云测试(CloudTesting)”服务的企业,自2011年成立以来,Testin基于云端提供移动相关测试设备超过50000部,拥有超过100项移动应用及相关领域独有的质量管理,测试技术专利;服务超过60万移动开发者、服务的移动APP数量超过160万,累计测试移动应用达1.3亿次。

据了解,Testin自成立以来,累计融资近1亿美金的投资,投资方分别为海银资本、高榕资本、IDG资本。“人口红利消失了,这个时候对效率的追求就出现了,许多企业开始追寻企业级服务。此外,近两年产能的过剩,供求关系发生变化。上游开始对渠道产生了巨大的依赖,这个时候渠道就有整合的机会。并且上游和渠道在赛跑,谁更快、更早地完成整合,谁就有话语权,就可以拿到更多的价值,”IDG副总裁张海涛谈到,IDG从2011年开始看企业服务,在2B的方向上,已经投资了四五十家公司,投资总额在过去一两年里在IDG整个投资额中占比超30%。

智能语音识别专家捷通华声,出席2016中国语音产业年会

近期,由于人工智能受到社会广泛关注,各种关于人工智能的会议层出不穷。由工业和信息化部指导,中国语音产业联盟主办的“2016中国语音产业联盟年会暨中国语音产业高峰论坛”在北京召开,捷通华声作为联盟理事单位出席并观摩了本次大会。

作为国内最早从事中文语音合成(TTS)技术研究与应用的企业,捷通华声在国内中文语音合成市场一直占有50%的市场份额,近年来,陆续推出了灵云语音识别、语义理解、声纹识别等全系列智能语音技术。经过十多年的技术积累和市场应用,灵云智能语音已广泛服务于金融、电信、能源、交通、教育、司法、公安、医疗、互联网等各领域、各行业,时刻为亿万社会大众提供着自然、流畅、稳定、优质的智能语音服务。

依靠在智能语音领域多年的技术积累,灵云语音识别技术经过几年快速的发展,电话端和手机端识别准确率均达到行业顶尖水平,具备识别率高、响应速度快、支持话者分离和智能语音端点检测,口音和方言适应能力强等优点。

灵云智能语音已全面支持中文、英文、维吾尔语、粤语等多国语种和地方语言的语音合成和识别,中英、粤英混读流畅,中文、英文、数字混读识别精准,全面满足多语种语音合成和语音识别的要求,与灵云语义理解相结合,形成了完整的灵云智能语音交互技术。

2016年,捷通华声推出了国内首项歌声合成技术——灵云歌唱合成技术,能唱出甜美可爱、悦耳动听,如真人般的歌声,成功实现让机器从“开口说话”到“放声歌唱”的跨越式进步。

本文分享自微信公众号 - BestSDK(bestsdk)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-05-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 灵云上线语音云:在线语音转写、合成、识别等功能

    捷通华声灵云语音云重磅上线灵云平台,为广大企业及个人提供专业级语音识别、语音合成等云服务,用灵云人工智能实现了便捷大众工作生活,同时标志着捷通华声在语音云服务领...

    BestSDK
  • 今年春晚将首次采用VR直播

    据了解,观众需要下载央视客户端来观看VR全景直播。除了VR,今年春晚晚会还会使用其他黑科技。 那么这场受全国几十亿观众关注的晚会上,采用VR全景直播还会不会发生...

    BestSDK
  • Qualcomm虚拟现实开发虚位以待:全新SDK上线

    编辑导语 Qualcomm于三月宣布将推出首款虚拟现实SDK,专门用于骁龙820移动SoC的VR应用开发。 新工具将为开发者提供对820处理器的高级优化与性能提...

    BestSDK
  • SAP S/4 HANA新变化-MM-IM物料帐:物料评估

    Material Ledger Obligatory for Material Valuation 物料帐强制启用 Description This simpl...

    SAP最佳业务实践
  • 内建NVIDIA Tegra K1的超强穿戴式装置改变视障人生活

    阅读食物标签、经过行人穿越道、认出自己的朋友,这些事情对大多数的人来说简单容易,但对那些视力受损的人来说,却是相当困难。 为了让视力有缺陷的人们能够更独立,一个...

    GPUS Lady
  • 注意力集中视觉刺激的波传播(CS AI)

    对周围视觉环境变化的快速反应需要有效的注意力机制,以将计算资源重新分配到视野中最相关的位置。尽管当前的计算模型由于数据的可用性不断提高而提高了其预测能力,但它们...

    刘子蔚
  • React Native 圆形进度条组件

    npm i--save react-native-circular-progress

    forrest23
  • leecode刷题(29)-- 二叉树的中序遍历

    希希里之海
  • 这11个免费学习的网站,个个堪称神器,不收后悔!

    导读:神奇的网站有很多,今天推荐11个和学习有关的,而且都是免费的,希望对大家有所帮助。

    华章科技
  • MongoDB用户和密码登录

    用户名:myTester 密码:xyz123 权限:读写数据库 test, 只读数据库 reporting。

    拓荒者

扫码关注云+社区

领取腾讯云代金券