问如何使用时间戳注释标记和提取音频
EN

Stack Overflow用户

提问于 2020-08-18 18:41:15

回答 2查看 580关注 0票数 0

我想标签，然后提取音频文件(audio.wav)的某些片段。段的开始和结束时间由另一个文件(注释文件(annot.csv))中的DateTimeStamp (第一列)和操作持续时间(以毫秒为单位)提供：

DateTimeStamp           Action  Duration of action in milliseconds
04/16/20 21:25:36:241   A       502
04/16/20 21:25:36:317   B       2253
04/16/20 21:25:36:734   X       118
04/16/20 21:25:36:837   C       10
04/16/20 21:25:37:537   D       797
04/16/20 21:25:37:606   X       70
04/16/20 21:25:37:874   A       1506
.                       .       .

audio.wav文件从文件annot.csv的第一个DateTimeStamp开始。如何使用annot.csv文件中的信息来标记和提取audio.wav文件中的某个片段(例如，对应于操作X)？

我试图用librosa和pyAudioAnalysis包来解决这个问题，但是我找不到所需的信息。任何帮助都非常感谢。

audio

timestamp

extract

librosa

labeling

Stack Overflow用户

发布于 2020-12-23 20:35:11

import io
import pandas
import numpy as np
import librosa
import soundfile as sf
def read_data(annot, date_format):
  df = pandas.read_csv(annot, sep=',')

  # Use proper pandas datatypes
  df['Time'] = pandas.to_datetime(df['DateTime'], format=date_format)
  df['Duration'] = pandas.to_timedelta(df['Duration ms'], unit='ms')
  df = df.drop(columns=['DateTime', 'Duration ms'])

  # Compute start and end time of each segment
  # audio starts at time of first segment
  first = df['Time'].iloc[0]
  df['Start'] = df['Time'] - first
  df['End'] = df['Start'] + df['Duration']

  return df

def extract_segments(y, sr, segments):
  # compute segment regions in number of samples
  starts = np.floor(segments.Start.dt.total_seconds() * sr).astype(int)
  ends = np.ceil(segments.End.dt.total_seconds() * sr).astype(int)

  # slice the audio into segments
  i = 0
  for start, end in zip(starts, ends):
    audio_seg = y[start:end]
    print('extracting audio segment:', len(audio_seg), 'samples')
    
    # file name string
    # it takes 5 first character of Action
    # and converts start and end time 
    file_name = str(segments.Activity[i][:5]) + \
    '__' + \
    str(segments.Start[i]).split('s ')[1].replace(':','_') + \
    '__' + \
    str(segments.End[i]).split('s ')[1].replace(':','_') + ".wav"
    
    sf.write(file_name, audio_seg, sr)
    i += 1
segments = read_data("annot.csv", date_format="%m/%d/%y %H:%M:%S:%f")
segments

y, sr = librosa.load("audio.wav", sr=16000, duration=2027)
extract_segments(y, sr, segments)

票数 0

查看全部 2 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63466930

复制

相似问题

问如何使用时间戳注释标记和提取音频
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用时间戳注释标记和提取音频EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用时间戳注释标记和提取音频
EN