首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何使用<p>保持JSoup标记之间的分离?

如何使用<p>保持JSoup标记之间的分离?
EN

Stack Overflow用户
提问于 2014-09-19 01:57:46
回答 1查看 231关注 0票数 0

我正试着写一个程序来得到一首歌的歌词。这是我第一次使用网站解析,我使用的是JSoup。我写了一个方法,可以给我歌词,但只作为一个大的,未格式化的字符串。

歌词的网站是:http://www.metrolyrics.com/lights-out-words-gone-lyrics-bombay-bicycle-club.html

它们用p标记和br标记分隔诗句,我不知道如何保持它们之间的分离。

这就是我现在拥有的:

代码语言:javascript
运行
复制
public static String getLyrics(String url) throws Exception
{
    int i = 0;
    String lyrics = "";
    Document document = Jsoup.connect(url).get();
    Elements lines = document.select("p.verse");
    String [] verses = new String[lines.size()];
    for(Element el : lines)
        verses[i++] = el.text();
    for(String verse : verses)
        lyrics = lyrics + verse + "\n";
    return lyrics;
}

谢谢你的帮助。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-09-19 05:54:22

代码语言:javascript
运行
复制
public static String getLyrics(String url) throws Exception {
    int i = 0;
    StringBuilder lyrics = new StringBuilder();
    Document document = Jsoup.connect(url).get();
    Elements lines = document.select("p.verse");
    String [] verses = new String[lines.size()];
    for(Element el : lines)
        verses[i++] = el.html();        

    for(String verse : verses)
        lyrics.append(verse + System.getProperty("line.separator") + System.getProperty("line.separator"));

    return lyrics.toString().replaceAll("<br>\\s+", System.getProperty("line.separator")).trim();
}
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25925198

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档