文章/答案/技术大牛

发布

社区首页 >问答首页 >基于卡尔迪x向量法的说话人分割

问基于卡尔迪x向量法的说话人分割
EN

Stack Overflow用户

提问于 2018-05-23 16:31:47

回答 1查看 611关注 0票数 1

我正在使用kaldi进行asr，现在我想使用Kaldi的x向量法进行说话人分割。他们在https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2 .They上提供了一些示例分割脚本，还在https://david-ryan-snyder.github.io/2017/10/04/model_sre16_v2.html上提供了一个基本的预训练模型

此预训练模型在未存档时具有以下结构：

我无法访问LDC语料库，我想知道如何在自己的数据上训练模型，然后如何使用该模型进行实际分割？

neural-network

speech-to-text

kaldi

回答 1

Stack Overflow用户

发布于 2018-05-25 01:41:15

我想知道如何根据我自己的数据训练模型

有一个使用公共数据的voxceleb demo，你可以自己运行它。

您还可以将数据格式化为适当的数据结构(创建data/utt2spk和data / with .scp文件)，并使用您的数据运行。

https://github.com/kaldi-asr/kaldi/tree/master/egs/voxceleb/v2

，然后如何使用该模型来进行实际的分割？

您可以从演示中的脚本开始，删除未使用的部分。这将为您提供基本的细分演示。您可以调用这个简化的演示来使用应用程序中的system(2)调用或以类似的方式进行分段。

然后，如果需要，您可以将脚本转换为相应的C++ API调用，并从C++或任何脚本语言调用相同的过程。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50483509

复制

相似问题

问基于卡尔迪x向量法的说话人分割
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于卡尔迪x向量法的说话人分割EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于卡尔迪x向量法的说话人分割
EN