首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python搜索网页中的元素并将其打印到不一致

Python搜索网页中的元素并将其打印到不一致
EN

Stack Overflow用户
提问于 2018-07-27 06:30:29
回答 1查看 642关注 0票数 0

好的,我想在网页中搜索h5头中的第一个链接,比如

<h5><a href="http://example.org/anything/">anything</a></h5>

我该如何告诉Python“任何东西”可以是任何东西?然后我该如何打印超链接(或标题)以引起不一致?

到目前为止,我已经设法获得了一个网站的源代码,使用:

代码语言:javascript
复制
import requests

link = "http://www.example.com" f = requests.get(link)

print(f.text)

我知道我可以使用以下命令将文本打印为不一致:

代码语言:javascript
复制
@bot.command(pass_context=True)
async def latest-release(ctx):
    await bot.say("This should be the mentioned Link")

我确实已经学习了本教程,但我似乎没有导入BeutifulSoup或BeautifulSoup……https://www.pythonforbeginners.com/beautifulsoup/scraping-websites-with-beautifulsoup

EN

回答 1

Stack Overflow用户

发布于 2018-07-27 07:53:50

如果您已经通过pip安装了bs4,那么您应该能够使用以下命令在Python3中导入它

代码语言:javascript
复制
from bs4 import BeautifulSoup

从那里,你把你的网页变成一个汤,并导航到你的超链接

代码语言:javascript
复制
header = soup.find("h5")
# or:
# header = soup.h5
# header = soup.find_all("h5")[0]
# Returns None if "h5" can't be found
link = header.a
url = link["href"]
text = link.text

以下是BeautifulSoup4的文档

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51548350

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档