谷歌开源人工智能图像识别模型和 VR 音频工具

文章来源：oschina周其

谷歌近日宣布开源两个重要项目：一个是谷歌最新的语义图像分割人工智能模型 DeepLab-V3+，另外一个是谷歌的空间音频 SDK——Resonance Audio。

“语义图像分割”指计算机识别照片或者视频中多个物体并用自然语言命名的过程。例如谷歌自家产品Google Photo不仅能够发现照片中的狗狗图像，还能够正确地将其标注为“狗”。在官方技术博客中，Google指出Pixel2的单镜头人像模式也适用该技术，但是Google表示DeepLab-V3+并未在Pixel2的拍照技术中应用。

Resonance Audio是Google去年发布的空间音频SDK，直到上周三才得以开源，该技术利用位置数据和声音过滤器在VR或AR应用中提供定位准确逼真的环绕立体声效果。Google在博客中指出，Resonance Audio将帮助开发者在移动端或桌面创建体验更棒的VR或AR应用，并且该SDK已经在《星战：绝地武士挑战》这个APP中得到应用。

上述两个工具的链接如下：

DeepLab-V3+ 、 Resonance Audio

来自：IT 经理网

发表于: 2018-04-012018-04-01 00:00:00
原文链接：https://www.oschina.net/news/94783/google-open-source-resonance-audio
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

谷歌开源人工智能图像识别模型和 VR 音频工具

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐