,可以通过使用HTML解析库或者正则表达式来实现。
如果使用HTML解析库,可以使用Python中的BeautifulSoup库或者Java中的Jsoup库。以下是使用BeautifulSoup库的示例代码:
from bs4 import BeautifulSoup
html = '''
<html>
<body>
<ul>
<li>数据1</li>
<li>数据2</li>
<li>数据3</li>
</ul>
<ul>
<li>数据4</li>
<li>数据5</li>
<li>数据6</li>
</ul>
</body>
</html>
'''
soup = BeautifulSoup(html, 'html.parser')
ul_tags = soup.find_all('ul')
for ul_tag in ul_tags:
li_tags = ul_tag.find_all('li')
for li_tag in li_tags:
print(li_tag.text)
输出结果为:
数据1
数据2
数据3
数据4
数据5
数据6
如果使用正则表达式,可以使用相应语言的正则表达式库进行匹配。以下是使用Python的re库的示例代码:
import re
html = '''
<html>
<body>
<ul>
<li>数据1</li>
<li>数据2</li>
<li>数据3</li>
</ul>
<ul>
<li>数据4</li>
<li>数据5</li>
<li>数据6</li>
</ul>
</body>
</html>
'''
pattern = r'<ul>(.*?)</ul>'
matches = re.findall(pattern, html, re.DOTALL)
for match in matches:
li_pattern = r'<li>(.*?)</li>'
li_matches = re.findall(li_pattern, match)
for li_match in li_matches:
print(li_match)
输出结果同样为:
数据1
数据2
数据3
数据4
数据5
数据6
以上是在2个ul标签之间抓取数据的方法,可以根据具体需求选择合适的方法进行实现。
领取专属 10元无门槛券
手把手带您无忧上云