首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

音视频开发之旅(66) - 音频变速不变调的原理

音频的原始pcm数据是由 采样率、采样通道数以及位宽而定。常见的音频采样率是44100HZ,即一秒内采样44100次,采样通道数 一般为2, 代表双声道,而位宽一般是16bit 即2个字节。 通过改变采样率进行音频的变速,比如音视频播放器中的 2 倍速,0.5 倍速播放。如果想要实现音频的2.0倍速播放,只需要每隔一个样本点丢一个点,即采样率降低一半。如果想要实现0.5倍速播放,只需要每隔一个样本点插入一个值为0的样本点。就可以了,理想很丰满,但是如果仅仅这样做,带来的不止是速度的变化,声音的音调也发生变化了,比如 周杰伦的声音变成了萝莉音,这是我们不期望的。

02

Soft-introspective VAEs:超越AlphaFold2,揭示K-Ras蛋白新视野

今天我们介绍华盛顿大学的David baker课题组发表在bioRxiv上的工作。探索蛋白质构象的整体,这些构象对功能有贡献,并且可以被小分子药物所靶向,仍是一个未解决的挑战。本文探讨了使用软自省变分自编码器(Soft-introspective Variational Autoencoders)来简化蛋白质结构集合生成问题中的维度挑战。通过将高维度的蛋白质结构数据转化为连续的低维表示,在此空间中进行由结构质量指标指导的搜索,接着使用RoseTTAFold来生成3D结构。本文使用这种方法为与癌症相关的蛋白质K-Ras生成集合,训练VAE使用部分可用的K-Ras晶体结构和MD模拟快照,并评估其对从训练中排除的晶体结构的采样范围。本文发现,潜在空间采样程序可以迅速生成具有高结构质量的集合,并能够在1埃范围内采样保留的晶体结构,其一致性高于MD模拟或AlphaFold2预测。

03

【AI安全专题】谁偷了我的模型:机器学习模型水印技术介绍与分析

近年来,人工智能(Artificial Intelligence)技术在生物医疗、金融风控、自动驾驶、网络安全等许多领域被广泛应用。基于数据驱动的机器学习技术在识别与分类等任务上已经具备稳定且精确的效果,在许多具体任务中,基于机器学习技术的方案不光能取得比传统技术方案更好的效果,还可以完成一些传统技术难以完成的任务。训练一个机器学习模型包含了大量工作,往往需要经年累月的投入才能得到高效稳定的成品模型,然而窃取和拷贝他人训练好的机器模型却十分容易[1][2]。为了保护机器学习模型开发者的知识产权,模型水印技术应运而生。

03

利用Tensorflow2.0实现卷积神经网络CNN

前面几节课我们给大家介绍的都是全连接神经网络,但全连接神经网络有个明显的缺点,那就是当网络层数较多时(尤其是在图像识别任务中),它每层的参数数量容易变得很大,不好控制。所以本节课老shi准备给大家介绍另外一种非常重要的网络结构——卷积神经网络。卷积神经网络(Convolutional Neural Network, CNN)近几年在深度学习中的应用非常广泛,特别是在图像识别、语音识别以及本文处理方面。可以说,卷积神经网络是深度学习中最重要的神经网络之一,例如图像识别中非常有名的LeNet、AlexNet、 ResNet、VGGNet、InceptionNet等网络结构都是在卷积神经网络基础上得来的。

02
领券