首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

腾讯会议如何保证语音质量?音频信号处理中有这些秘籍!

导读 | 腾讯会议在去年年底推出,集结腾讯在AI、云计算、安全等方面的能力,全方位满足不同场景下的会议需求,在短短两个月内就突破千万日活大关。面对多样且复杂的场景,比如开会环境嘈杂、同一地点多设备接入、房间声学参数不理想等,腾讯会议如何通过对音频信号的处理持续保障高品质通话,提升沟通效率?本文是腾讯多媒体实验室音频技术专家李岳鹏在「腾讯技术开放日·云视频会议专场」的分享整理。 点击视频,查看直播回放 一、TRAE技术降噪增益揭秘 先简单讲一下VOIP中语音数据实时传输路径图,我们可以看到远端的数据通过

092

一文带你了解机器人是如何通过视觉实现目标跟踪的!

视觉跟踪技术是计算机视觉领域(人工智能分支)的一个重要课题,有着重要的研究意义。在军事制导、视频监控、机器人视觉导航、人机交互、以及医疗诊断等许多方面有着广泛的应用前景。随着研究人员不断地深入研究,视觉目标跟踪在近十几年里有了突破性的进展,使得视觉跟踪算法不仅仅局限于传统的机器学习方法,更是结合了近些年人工智能热潮—深度学习(神经网络)和相关滤波器等方法。本文主要介绍以下几点:什么是视觉目标跟踪(单目标跟踪)、单目标跟踪的基本结构(框架),目标跟踪存在的挑战,目标跟踪经典相关方法及研究趋势等。

02

计算机视觉中,目前有哪些经典的目标跟踪算法?

【新智元导读】这篇文章将非常详细地介绍计算机视觉领域中的目标跟踪,尤其是相关滤波类方法,分享一些作者认为比较好的算法。 相信很多来这里的人和我第一次到这里一样,都是想找一种比较好的目标跟踪算法,或者想对目标跟踪这个领域有比较深入的了解,虽然这个问题是经典目标跟踪算法,但事实上,可能我们并不需要那些曾经辉煌但已被拍在沙滩上的tracker(目标跟踪算法),而是那些即将成为经典的,或者就目前来说最好用、速度和性能都看的过去tracker。我比较关注目标跟踪中的相关滤波方向,接下来我帮您介绍下我所认识的目标跟踪,

010

SORT新方法AM-SORT | 超越DeepSORT/CO-SORT/CenterTrack等方法,成为跟踪榜首

基于运动的多目标跟踪(MOT)方法利用运动预测器提取时空模式,并估计未来帧中的物体运动,以便后续的物体关联。原始的卡尔曼滤波器广泛用作运动预测器,它假设预测和滤波阶段分别具有常速和高斯分布的噪声,分别对应于。常速假设物体速度和方向在短期内保持一致,高斯分布假设估计和检测中的误差方差保持恒定。虽然这些假设通过简化数学建模使卡尔曼滤波器具有高效性,但它们仅适用于特定场景,即物体位移保持线性或始终较小。由于忽略了具有非线性运动和遮挡的场景,卡尔曼滤波器在复杂情况下错误地估算物体位置。

01

学习用于视觉跟踪的深度紧凑图像表示

在本文中,我们研究了跟踪可能非常复杂背景的视频中运动物体轨迹的挑战性问题。与大多数仅在线学习跟踪对象外观的现有跟踪器相比,我们采用不同的方法,受深度学习架构的最新进展的启发,更加强调(无监督)特征学习问题。具体来说,通过使用辅助自然图像,我们离线训练堆叠去噪自动编码器,以学习对变化更加鲁棒的通用图像特征。然后是从离线培训到在线跟踪过程的知识转移。在线跟踪涉及分类神经网络,该分类神经网络由训练的自动编码器的编码器部分构成,作为特征提取器和附加分类层。可以进一步调整特征提取器和分类器以适应移动物体的外观变化。与一些具有挑战性的基准视频序列的最先进的跟踪器进行比较表明,当我们的跟踪器的MATLAB实现与适度的图形处理一起使用时,我们的深度学习跟踪器更准确,同时保持低计算成本和实时性能单位(GPU)。

05

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【新智元导读】不同于在目标检测和识别等领域取得的丰硕成果,深度学习在目标跟踪领域进展相对缓慢,很大原因是缺乏数据——目标跟踪只有第一帧的标定框作为训练数据,在这种情况下训练一个深度模型十分困难。现有的基于深度学习的方法从几个不同的角度解决这个问题,但在跟踪速度和精度方面仍有很大的提升空间。 在目标追踪界泰斗、UC Merced 杨明玄教授的指导下,香港城市大学、阿德莱德大学、SenseNet的研究人员从深度学习的角度出发,提出了一种端到端的跟踪模型,将特征提取和响应生成融合在深度学习框架中,只采用单层卷积的

07

学习笔记:深度学习之“学习”

在上一篇文章中,我们谈到机器学习“学习”的是“规则”。进一步而言,机器学习需要一套评判机制来测量相应机器学习算法的性能。这套评判机制需要将当前输出与期望输出的“差异”做为反馈信号来调整算法。这个调整的过程就是所谓的“学习”。这种“学习”其实并不陌生。在数字信号处理中,有一类滤波器称为自适应滤波器(Adaptive Filter),它能够根据输入信号自动调整性能进行数字信号处理,如下图所示。输入信号x(n)通过参数可调数字滤波器后产生输出信号(或响应)y(n),将其与参考信号(或称期望响应)d(n)进行对比,形成误差信号e(n),并以此通过某种自适应算法对滤波器参数进行调整,最终使e(n)的均方值最小。常常将这种输入统计特性未知,调整自身的参数到最佳的过程称为“学习过程”。将输入信号统计特性变化时,调整自身的参数到最佳的过程称为“跟踪过程”,因此,自适应滤波器具有学习和跟踪的性能。

02

DSST详解

有一段时间没有看tracking了,前面一个月老师没有找,我也没有看文章,主要去看c++和cs231n去了。上周一老师找了我一次,于是赶紧把tracking又拾起来,把老师给的视频在前面的代码上跑了下,这周又看了篇新论文。 最开始的应该是MOOSE,作者没有给源码,所以论文理解得并不是很透彻,CSK以及KCF/DCF都是仔细研究了源码的,自认为还算比较了解了,接下来的CN,其实了解了KCF/DCF就很简单了,无非是另一种多特征的融合,融合方式都差不多。 昨天开始看DSST,只看了前面的部分,后边的实验没有怎么看,又去看了下matlab的源码,代码结构很清晰,因为框架还是CSK得大框架,结合作者的注释很快就看完了,做个整理。 MOOSE paper 是跟踪领域相关滤波的第一篇文章,开创性意义。 CSK paper 利用循环矩阵解决了训练量的问题,不用在进行随机仿射来得到样本。这个是单通道的, 作者只使用了灰度信息。 KCF/DCF paper 和CSK是同一个作者,和CSK的改进很小,主要贡献和CSK相比在于提供了一种把多通道特征融合进相关滤波框架的方法。 CN paper 和KCF/DCF是同一时期的,不同的是用了颜色通道,论文里作者比较了各种颜色空间的表现。 DSST paper DSST解决了另外一个关键问题,那就是尺度更新。 这5篇文章是相关滤波的基础,今天这里主要写一下DSST的论文思路。

03

FPGA图像处理之高斯滤波算法理论篇

对计算机视觉、多媒体应用、通信技术等领域来说,实时的数字图像处理是其中的重点学科之一。传统的前端数字信号处理(Digital SignalProcessing,DSP)算法,例如 FFT、FIR、IIR 滤波器,大多都是利用 ASIC 或者 PDSP 来构建的,在硬件的实现中很难满足实时性的要求。现场可编程逻辑门阵列(Field ProgrammableGate Arrays, FPGA)技术在数字信号处理中的应用,将逐渐成为前端信号处理的主流。而滤波器算法在信号处理、信号检测、通信领域有着重要的作用,在实时信息处理系统中,对滤波器的性能和处理速度有着严格的要求,特别是在满足系统性能的条件下,处理速度至关重要。

04

PointTrackNet:一种用于点云三维目标检测和跟踪的端到端网络

当前基于机器学习的多目标跟踪(MOT)框架在3-D点云跟踪场景中变得越来越流行。大多数传统的跟踪方法都使用滤波器(例如,卡尔曼滤波器或粒子滤波器)来按时间顺序预测对象位置,但是它们容易受到极端运动条件的影响,例如突然制动和转弯。在本文中提出了PointTrackNet目标跟踪方法,这是一个端到端的3-D对象检测和跟踪网络,可以为每个检测到的对象生成前景掩膜,3-D边界框和点跟踪关联位移。网络仅将两个相邻的点云帧作为输入。在KITTI跟踪数据集上的实验结果显示,与最新的跟踪网络相比本文的方法具有比较好的结果,尤其是在不规则和快速变化的情况下。

01
领券