VR虚拟现实技术：三维虚拟声音的实现技术，自然交互与传感技术

文章来源：企鹅号 - 科技眼观察

三维虚拟声音的实现技术

三维虚拟声音系统的核心是声音定位技术，它有三个主要特征，分别是全向三维定位特性、三维实时跟踪特性与沉浸感与交互感。全向三维定位特性是指在三维虚拟空间中把实际声音信号定位到特定虚拟专用源的能力。它能使用户准确判断出声音的精确位置，从而符号人们的真实听觉方式。三维实时跟踪图像是指三维虚拟空间中实时跟踪虚拟声音位置变化的能力。三维虚拟声音的沉浸感指加入三维虚拟声音后能使用户产生身临其境的感觉，有助于增强临场效果。三维声音的交互特性是指随用户的运动而产生的临场反应和实时响应能力。

用语音和虚拟现实进行交互是我们的一个目标。语音技术主要分为语音识别技术和语言合成技术。语音识别技术是指将人说话的语言信号转换为可以被计算机程序所识别的信息。一般包括参数提取，参考模式建立，模式识别等过程。语音合成技术是指用人工的方法产生语音技术。实现语音输出有两种方法，一是录音/重放；二是文—语转换。如果将语音合成与语音识别技术结合起来，就可以让用户和虚拟环境进行简单的语音交互了，从而实现人机自然的交互。

自然交互与传感技术

1、手势识别

手势识别可以分为两种，一种是基于数据手套的识别，另一种是基于视觉的手势识别。基于数据手套的手势识别系统就是利用数据手套和位置跟踪器来捕捉手势的运动轨迹和检测手的方向，手指弯曲程度等信息，根据这些信息对手势进行分析。这种方法的优点是系统识别率高，缺点是不方便。基于视觉的手势识别是从视觉通道获得信号，通常采用摄像机采集手势信息，由摄影机连续拍摄手的运动，再用边界特征识别的方法判断出具体手势。这种方法的优点是输入设备简单，但识别率较低，实时性较差。

2、面部表情的识别

根据对人脸知识的利用方式，可以将人脸检测分为两大类：基于特征的人脸检测方法和基于图像的人脸检测方法。基于特征的人脸检测方法直接利用人脸信息，比如人脸肤色，人脸的几何构造等。基于图像的人脸检测方法不直接利用人脸信息，而是将人脸检测问题看作一般的模式识别问题。

网络虚拟现实系统的网络架构有3 种：对等模型、客户服务器模型、和混合的架构

（1）对等模型。

每个对等实体共享其他对等实体的资源，没有客户和服务器的区别。这种对等模型使每个对等实体直接发送包给任一其他对等实体。对等模型具有低延迟的优点，因为数据包直接通过最短路径从发送方到接收方。但对等模型有伸缩性问题。因为随着对等实体数量增多，它们发送的数据包的数量会快速增长。

（2）客户/服务器模型。客户服务器模型是一种集中管理模型，由服务器完成管理任务。客户服务器模型能有效管理数据，过滤服务，但有更大的延迟，每个包从源主机到目的主机交换需要通过服务器。因为一个服务器负担与每一个客户通信的任务，所以随着虚拟现实参与者增加，服务器必须处理更大的通信量。服务器成为限制虚拟现实用户参与数量的一个瓶颈。

（3）混合模型。由对等模型和客户服务器模型相结合的模型称为对等服务器模型，或称为混合模型。混合模型利用了这两种模型的优点。对等通信模型用在短距离高宽带的局域网，而客户服务器通信用在长距离低宽带的广域网上。混合模型体现了通信中速度和距离的一种折中。它是一种自适应的网络虚拟环境系统的体系结构。

发表于: 2019-02-132019-02-13 19:19:57
原文链接：https://kuaibao.qq.com/s/20190213A11S0000?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

VR虚拟现实技术：三维虚拟声音的实现技术，自然交互与传感技术

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐