文章/答案/技术大牛

发布

社区首页 >问答首页 >当在librosa.load上改变采样率时，如何改变librosa.onset.onset_strength？

问当在librosa.load上改变采样率时，如何改变librosa.onset.onset_strength？
EN

Stack Overflow用户

提问于 2019-12-16 10:43:58

回答 1查看 889关注 0票数 0

我试图用以下代码从音频文件(采样率:2000)中提取节奏和节拍：

data, sr = librosa.load(path, mono=True, sr=2000)
print ("self.sr :", sr)
onset_env = librosa.onset.onset_strength(data, sr=sr)
tempo, beats = librosa.beat.beat_track(data, sr=sr, onset_envelope=onset_env)
print ("tempo :", tempo)
beats = librosa.frames_to_time(beats, self.sr)
print ("beats :", beats)

我只改变了样本率

但。输出很奇怪

/usr/lib/python3.6/site-packages/librosa/filters.py:284: UserWarning: Empty filters detected in mel frequency basis. Some channels will produce empty responses. Try increasing your sampling rate (and fmax) or reducing n_mels.
  warnings.warn('Empty filters detected in mel frequency basis. '
/usr/lib64/python3.6/site-packages/scipy/fftpack/basic.py:160: FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`. In the future this will be interpreted as an array index, `arr[np.array(seq)]`, which will result either in an error or a different result.
  z[index] = x
tempo : 117.1875
beats : [  4   6   8  10  12  14  16  18  20  22  24  26  28  30  32  34  36  38
  40  42  44  46  48  50  52  54  56  58  60  62  64  66  68  70  72  74
  76  78  80  82  84  86  88  90  92  94  96  98 100 102 104 106 108 110
 112 114 116 118 120 122 124 126 128 130 132 134 136 138 140 142 144 146
 148 150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 182
 184 186 188 190 192 194 196 198 200 202 204 206 208 210 212 214 216 218
 220 222 224 226 228 230 232 234 236 238 240 242 244 246 248 250 252 254
 256 258 260 262 264 266 268 270 272 274 276 278 280 282 284 286 288 290
 292 294 296 298 300 302 304 306 308 310 312 314 316 318 320 322 324 326
 328 330 332 334 336 338 340 342 344 346 348 350 352 354 356 358 360 362
 364 366 368 370 372 374 376 378 380 382 384 386 388 390 392 394 396 398
 400 402 404 406 408 410 412 414 416 418 420 422 424 426 428 430 432 434
 436 438 440 442 444 446 448 450 452 454 456 458 460 462 464 466]

因此，我删除了sr参数并运行以下代码：

data, sr = librosa.load(path, mono=True)
print ("self.sr :", sr)
onset_env = librosa.onset.onset_strength(data, sr=sr)
tempo, beats = librosa.beat.beat_track(data, sr=sr, onset_envelope=onset_env)
print ("tempo :", tempo)
beats = librosa.frames_to_time(beats, self.sr)
print ("beats :", beats)

这里是移除sr输出

self.sr : 22050
/usr/lib64/python3.6/site-packages/scipy/fftpack/basic.py:160: FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated; use `arr[tuple(seq)]` instead of `arr[seq]`. In the future this will be interpreted as an array index, `arr[np.array(seq)]`, which will result either in an error or a different result.
  z[index] = x
tempo : 161.4990234375
beats : [   7   23   39   55   71   87  102  118  134  150  166  182  197  213
  228  244  260  276  292  307  323  339  355  371  387  404  420  438
  454  470  486  501  517  533  549  565  581  596  612  628  644  659
  675  691  706  722  738  754  770  786  801  817  833  850  868  884
  900  916  932  948  964  980  996 1011 1027 1043 1059 1074 1090 1106
 1121 1137 1153 1168 1184 1201 1216 1232 1248 1264 1279 1293 1312 1331
 1347 1363 1379 1394 1410 1426 1442 1458 1474 1489 1505 1520 1536 1552
 1568 1584 1599 1615 1631 1647 1663 1679 1696 1712 1730 1746 1762 1778
 1793 1809 1825 1841 1857 1873 1888 1904 1920 1936 1951 1967 1983 1998
 2014 2030 2046 2062 2078 2093 2109 2125 2142 2160 2176 2192 2208 2224
 2240 2256 2272 2288 2303 2319 2335 2351 2366 2382 2398 2413 2429 2445
 2460 2476 2492 2508 2524 2540 2556 2571 2585 2604 2623 2639 2655 2671
 2686 2702 2718 2734 2750 2766 2781 2797 2812 2828 2844 2860 2876 2891
 2907 2923 2939 2955 2971 2988 3004 3022 3038 3054 3070 3085 3101 3117
 3133 3149 3165 3180 3196 3212 3228 3243 3259 3275 3290 3306 3322 3338
 3354 3370 3385 3401 3417 3434 3452 3468 3484 3500 3516 3532 3548 3564
 3580 3595 3611 3627 3643 3658 3674 3690 3705 3721 3737 3752 3768 3784
 3800 3816 3832 3848 3863 3877 3896 3915 3931 3947 3963 3978 3994 4010
 4026 4042 4058 4073 4089 4104 4120 4136 4152 4168 4183 4199 4215 4231
 4247 4263 4280 4296 4314 4330 4346 4362 4377 4393 4409 4425 4441 4457
 4472 4488 4504 4520 4535 4551 4567 4582 4598 4614 4630 4646 4662 4677
 4693 4709 4726 4744 4760 4776 4792 4808 4824 4840 4856 4872 4887 4903
 4919 4935 4950 4966 4982 4997 5013 5029 5044 5060 5076 5092 5108 5124]

当我更改sr时，如何使工作正常进行？

谢谢

librosa

python

audio

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-12-18 06:08:11

打电话时

data, sr = librosa.load(path, mono=True, sr=2000)

您要求librosa重新采样输入到2000 Hz (参见文档：“目标采样率”)。对于音乐来说，2000 Hz是一个非常不寻常的采样频率，很可能IMHO中的一些算法在librosa中无法正常工作。相反，典型的速率是44.1 kHz (CD质量)或22050 Hz ( librosa默认值)。

我假设拍跟踪器试图将你的数据分割成mel波段，然后单独处理这些波段，也许是用一些新奇的曲线或开始的信号函数，但是2 kHz并不是所有需要处理的东西，这可能就是为什么你看到了空的过滤信息。但是，如果结果(对于sr=2000)是正确的，您可以忽略警告。

然而，这似乎是一个更安全的赌注，对我来说，简单地不设置sr，让librosa重采样您的音频(无论是什么)到22050赫兹，然后运行拍频跟踪算法。22050 Hz是最有可能在测试上开发出来的采样率，也是最有可能成功的。

关于：

/usr/lib64/python3.6/site-packages/scipy/fftpack/basic.py:160: FutureWarning:建议使用非元组序列进行多维索引；使用arr[tuple(seq)]而不是arr[seq]。在未来，这将被解释为数组索引arr[np.array(seq)]，这将导致一个错误或一个不同的结果。

这看起来像是一个警告，与librosa如何实施某些东西有关。你应该能够忽略它而不产生任何后果。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59354996

复制

相似问题

问当在librosa.load上改变采样率时，如何改变librosa.onset.onset_strength？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当在librosa.load上改变采样率时，如何改变librosa.onset.onset_strength？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问当在librosa.load上改变采样率时，如何改变librosa.onset.onset_strength？
EN