我正试着写一个程序来得到一首歌的歌词。这是我第一次使用网站解析,我使用的是JSoup。我写了一个方法,可以给我歌词,但只作为一个大的,未格式化的字符串。
歌词的网站是:http://www.metrolyrics.com/lights-out-words-gone-lyrics-bombay-bicycle-club.html
它们用p标记和br标记分隔诗句,我不知道如何保持它们之间的分离。
这就是我现在拥有的:
public static String getLyrics(String url) throws Exception
{
int i = 0;
String lyrics = "";
Document document = Jsoup.connect(url).get();
Elements lines = document.select("p.verse");
String [] verses = new String[lines.size()];
for(Element el : lines)
verses[i++] = el.text();
for(String verse : verses)
lyrics = lyrics + verse + "\n";
return lyrics;
}谢谢你的帮助。
发布于 2014-09-19 05:54:22
public static String getLyrics(String url) throws Exception {
int i = 0;
StringBuilder lyrics = new StringBuilder();
Document document = Jsoup.connect(url).get();
Elements lines = document.select("p.verse");
String [] verses = new String[lines.size()];
for(Element el : lines)
verses[i++] = el.html();
for(String verse : verses)
lyrics.append(verse + System.getProperty("line.separator") + System.getProperty("line.separator"));
return lyrics.toString().replaceAll("<br>\\s+", System.getProperty("line.separator")).trim();
}https://stackoverflow.com/questions/25925198
复制相似问题