这是我的密码。当输出打印时,在段落之间打印空白也。如何删除段落之间的空格,然后逐句存储在数组列表中。
public static void main(String[] args) {
try {
String url = "http://www.divaina.com/";
System.setProperty("http.proxyHost", "cache.mrt.ac.lk");
System.setProperty("http.proxyPort", "3128");
Document doc = Jsoup.connect(url).timeout(10000).get();
Elements paragraphs = doc.select("p");
for(Element p : paragraphs){
System.out.println(p.text());}
}
catch (IOException ex) {
ex.printStackTrace();
}
}
当我直接将内容添加到数据库中时,空白也会添加它。如何删除段落之间的空白?实际上,我想阅读网页的内容,逐行添加到数据库中。还有其他合适的方法吗?
发布于 2014-11-22 04:13:02
显然,有些段落没有案文。这可能有助于:
for (Element p : paragraphs)
{
if (p.text().length() != 0)
System.out.println(p.text());
}
发布于 2014-11-22 01:47:15
使用正则表达式:
String withoutspace = whitespace.replaceAll("\\s", "");
或者试试这个
String withoutSpace = whitespace.replace("\n", "").replace("\r", "");
https://stackoverflow.com/questions/27075992
复制