我在MP3s中有数以千计的非英语歌曲&数以千计的PPT,每个都显示一首歌曲的歌词。我想写一个java程序来匹配正确的MP3和它的PPT。
我可以想到两个策略。我不知道它们是否接近实现:- 1.通过某种非英语语音识别从歌曲中提取歌词,并将其与从PPTs中提取的文本歌词进行比较。2.播放歌曲生成波形。制作一个类似于"Windows讲述人“的程序来读取PPTs中的歌词,以获得其波形,然后尝试将两者进行匹配。
注:- 1.所有的MP3s都没有嵌入歌词。2. PPTs中的歌词是打字输入的,它们不是图像,所以不需要考虑OCR。
我想知道你们可以想出的任何其他策略&最重要的是,请写下任何对我有帮助的java包。
有没有涉及到傅里叶变换?
发布于 2011-08-03 22:55:59
另一种方法是:编写一些东西来从PPT中提取文本,并将文本加上PPT文件的名称放入数据库、文本文件或任何可搜索的文件中。
编写另一个小应用程序,一次递给用户一个歌曲文件;给他们一种播放歌曲片段的方法,一个键入歌词的文本框,以及一个搜索按钮,它将在你的PPT歌词中搜索匹配项。当他们找到匹配项时,另一个按钮根据数据库或其他文件中匹配的歌词文件记录MP3的名称。
雇佣几个聪明的大学生/高中生来听/搜索。
我敢打赌,这个项目将在比你考虑做的时间和成本少得多的情况下完成。
发布于 2011-08-03 22:41:33
此外,请记住,您可能需要执行一些相似性计算,因为演唱的文本并不总是等于所写的歌词。
我要说的是,编写这样的任务是相当广泛的,需要整个团队来实现。你确定你能处理好吗?
https://stackoverflow.com/questions/6928193
复制相似问题