首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >BeautifulSoup获取链接的内容/文本

BeautifulSoup获取链接的内容/文本
EN

Stack Overflow用户
提问于 2021-02-28 18:30:14
回答 1查看 40关注 0票数 0
代码语言:javascript
运行
复制
URL = "https://bitcointalk.org/index.php?board=1.0"
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
links_with_text = []


for random in soup.find_all("span", attrs={"id": re.compile("^msg")}):
    for b in random.find_all('a', href=True):
          print(b['href'])

上面的代码运行得很好。我可以从第一页获取所有主题,但问题出在获取主题名称上。有什么想法吗?

EN

Stack Overflow用户

回答已采纳

发布于 2021-02-28 18:59:57

下面的代码应该可以工作:

代码语言:javascript
运行
复制
URL = "https://bitcointalk.org/index.php?board=1.0"
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
links_with_text = []

for random in soup.find_all("span", attrs={"id": re.compile("^msg")}):
    for b in random.find_all('a', href=True):
          print(b['href'])
          print(b.string)

示例输出:

代码语言:javascript
运行
复制
...
https://bitcointalk.org/index.php?topic=5320354.0
Craig Wright's Latest Escapade -- Give me the bitcoins I stole from Mt. Gox!
https://bitcointalk.org/index.php?topic=5233719.0
Opera now lets US users buy crypto with Apple Pay or debit card
...
票数 1
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66408044

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档