首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

python 分水岭算法的实现

“”“ watershed.py-分水岭算法 该模块实现了分水岭算法,可将像素分配到标记的盆地中。 该算法使用优先级队列来保存像素,优先级队列的度量标准是像素值,然后输入队列的时间-这将使关系更加紧密,有利于最接近的标记。 一些想法取自Soille,“使用数学形态从数字高程模型自动进行盆地划定”,信号处理20(1990)171-182。 该论文最重要的见解是,进入队列的时间解决了两个问题:应将像素分配给具有最大梯度的邻居,或者,如果没有梯度,则应将高原上的像素分配在相对侧的标记之间。 最初是CellProfiler的一部分,代码已获得GPL和BSD许可。 网址:http://www.cellprofiler.org 版权所有(c)2003-2009麻省理工学院 版权所有(c)2009-2011 Broad Institute 版权所有。 原作者:Lee Kamentsky

05

机器学习会议论文(三)StarGAN-VC实现非并行的语音音色转换

2.The introduction starGAN-VC是将一篇语音方向的论文,在上一篇论文中我们介绍了starGAN的网络结构以及工作原理,以及starGAN是如何实现多域的图像风格迁移,但是starGAN-vc则是进行了领域的融合与迁移,vc是(voice conversion),也就是将图像领域的starGAN放入语音领域,进行语音的音色转换,在图像领域我们实现性别的转换,比如将一张male picture转换为female picture,当然指的是风格迁移。starGAN-VC则是将模型放入语音,将male voice转换为female voice。 3.The related work starGAN与StarGAN-vc的网络模型相似,变化不大,但是图像信号与语音信号的差别比较大,语音信号是典型的时序信号,可以理解为一个一维数组的数据,对于神经网络来说处理运算的是矩阵数据,所以需要对语音信号进行预处理,才能实现网络的可以接受的数据格式 (1)对于语音信号需要进行语音信号的特征提取——梅尔频率倒谱系数(MFCC) MFCC中包涵语音信号的特征,同时以矩阵的形式进行的存储, MFCC:Mel频率倒谱系数的缩写。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。

01

tf.train.batch

在张量中创建多个张量。参数张量可以是张量的列表或字典。函数返回的值与张量的类型相同。这个函数是使用队列实现的。队列的QueueRunner被添加到当前图的QUEUE_RUNNER集合中。 如果enqueue_many为False,则假定张量表示单个示例。一个形状为[x, y, z]的输入张量将作为一个形状为[batch_size, x, y, z]的张量输出。如果enqueue_many为真,则假定张量表示一批实例,其中第一个维度由实例索引,并且张量的所有成员在第一个维度中的大小应该相同。如果一个输入张量是shape [*, x, y, z],那么输出就是shape [batch_size, x, y, z]。容量参数控制允许预取多长时间来增长队列。返回的操作是一个dequeue操作,将抛出tf.errors。如果输入队列已耗尽,则OutOfRangeError。如果该操作正在提供另一个输入队列,则其队列运行器将捕获此异常,但是,如果在主线程中使用该操作,则由您自己负责捕获此异常。

01
领券