使用BeautifulSoup从抓取后提取单词_使用BeautifulSoup从抓取的页面中提取文本_使用BeautifulSoup从Lazada上抓取价格 - 腾讯云开发者社区

python、web、url、beautifulsoup

我在网页上使用BeautifulSoup4收集了一些信息：https://www.peakbagger.com/list.aspx?lid=5651 from urllib.request import urlopenimport pandas as pd html = urlopen(url) soup = BeautifulSoup(html, 'html.parser

浏览 21提问于2021-09-28得票数 0

回答已采纳

2回答

从word河马中进行网络抓取

python-3.x、web-scraping、beautifulsoup

我有一个关于从单词河马中抓取单词的问题。我对Beautiful Soup是个新手，不知道如何获取这个单词列表(如下所述) 我正在尝试获取页面以下部分下的所有同义词(甚至是“更多”按钮下的那些同义词。第1节 ? 第2节 ? #My code.from bs4 import BeautifulSoup response = requests.get("https://www.wordhippo.com/

浏览 38提问于2021-01-24得票数 1

回答已采纳

1回答

未使用python正确检索csv文件中的信息

python、web-scraping、beautifulsoup

我正在从这个中抓取一些内容。在从csv文件中提取站点后，像会议负责人一样书写时，名字不会正确出现，例如，如果单词是microsoft，它会以osoft出现，但其余所有单词都会正确出现import csvfrom bs4 import BeautifulSoup a = csv.writer(a.writer

浏览 3提问于2016-03-03得票数 0

3回答

Python -抓取谷歌的简单方法，为给定的搜索下载前N个命中结果(整个.html文档)？

python、web-scraping、urllib2、google-search

有没有一种简单的方法来抓取谷歌，并为给定的搜索写出前N个(比如说1000个) .html (或其他任何)文档的文本(只是文本)？我假设这将使用urllib2库？如果有帮助的话，我会使用Python 3.1。

浏览 2提问于2011-03-16得票数 10

回答已采纳

1回答

如何配置Scrapy以使用BeautifulSoup解析器

python、web-scraping、beautifulsoup、scrapy

我使用BeautifulSoup的默认html.parser从任何网页中提取数据，没有什么原因让我觉得它比使用XPATH/CSS选择器更灵活、更强大。在抓取之前，我学习了使用BeautifulSoup进行网络抓取。我想不出一种让Scrapy使用bs4作为解析器的方法。有可能吗？

浏览 2提问于2019-08-18得票数 0

回答已采纳

1回答

Python如何抓取图像、文本和指向音频文件url的链接

python、python-3.x、xpath、web-scraping

我正在尝试从以下url (http://www.ancient-hebrew.org/m/dictionary/1000.html)中抓取数据。例如，url中的第一个条目是"img1 img2 img3אֶלֶףe-leph“希伯来语单词是使用wget下载html后的unicode。我正在尝试按顺序收集这些信息，以便首先获得图像文件，然后是希伯来语单词，然后是发音。最后，我想找到音频文件的URL。而且，每个单词</em

浏览 16提问于2019-06-11得票数 2

3回答

如何使用正则表达式获取同时包含空格和字符的文本？

python、regex、web-scraping

我使用正则表达式仅获取国家名称，但是省略了包含空格的国家名称(刚果、韩国、英国等)。import requestsfrom bs4 import BeautifulSoup soup = BeautifulSoup(pop.text, "html.p

浏览 1提问于2020-08-01得票数 1

2回答

尝试从同一下拉菜单下载多个文件- Python Selenium Chromedriver

python-3.x、selenium、selenium-webdriver、selenium-chromedriver

我在尝试使用Selenium Chromedriver从网站上的同一下拉菜单下载两个单独的文件时遇到了问题。我有代码来单击这两个链接，但它只确认第一个链接；第二个文件不会被下载。我知道，当我不使用webdriver时，我可以同时进行多个下载，所以可能问题是chromedriver一次只允许一个下载？我没有把握。for shapefile download ###ShapefileLink.click()

浏览 25提问于2020-09-09得票数 1

回答已采纳

1回答

Python web抓取: google搜索结果中的网站

python、html、web-scraping、web-crawler、google-crawlers

我想从一个谷歌搜索页面从多个网站(例如100+)提取信息。我只想提取关键信息，例如那些带有<h1>、<h2>或<b>或<li> HTML标签的信息等，但我不想提取整个段落的<p>。我知道如何从google搜索中收集网站URL列表；我还知道如何在查看页面的HTML后对单个网站进行网络抓取。我使用Request和BeautifulSoup来完成这些任务。但是，我想知道如何

浏览 18提问于2021-03-31得票数 1

1回答

当[' href ']元素是超链接时如何提取href

python、beautifulsoup、onclick、href

我正在尝试从网页中抓取数据，然后通过提取下一页的href来转到下一页。r = requests.get(url) 我使用findAll()函数来获取

浏览 1提问于2020-01-08得票数 1

1回答

如何正确地从带有utf8的网页中提取BeautifulSoup4文本(日语符号)

python、utf-8、beautifulsoup

现在我正在尝试从这些页面中提取我需要的一些数据。问题在于这些数据中包含的日语单词。英语单词的提取非常完美。section.get_text(strip=True) 还有一些，我也尝试用URLencoding对生成的文本进行编码奇怪(但并不完全)的方法之一是将字符串保存

浏览 2提问于2019-10-07得票数 3

1回答

用BeautifulSoup* - HTML不同格式从CSS类链接中提取标题*

python、beautifulsoup

我刚开始使用BeautifulSoup进行网络抓取，并遇到了以下问题:我试图从论坛上抓取帖子，我想提取帖子的标签。如何提取“高级物理”？

浏览 5提问于2021-06-08得票数 0

回答已采纳

1回答

无法使用regex刮取网站的某些值。

python、regex、python-2.7、web-scraping

print("Status: " + str(status))不幸的是，它只返回："Status: []" 然而，尽管如此，我不知道我做错了什么，因为当我在同一个网站上测试时，我可以使用代码

浏览 2提问于2014-05-15得票数 0

回答已采纳

1回答

通过IMAP抓取电子邮件HTML

python、html、web-scraping、beautifulsoup、imap

我正在尝试用BeautifulSoup编写一个从Gmail帐户的电子邮件中抓取html表格的工具。使用IMAP，脚本会间歇性地检查收件箱。不过，我不确定如何从电子邮件中提取HTML，这是抓取表格所需的。目前，它提取正文文本，而不是原始的HTML：items = ite

浏览 0提问于2014-01-07得票数 0

1回答

解析python中的html值

python、html、beautifulsoup

:0px;background-color:#f3f3f3" type="submit" value="▾"/> </td> 我需要从value="25“和value="0”中提取两个数字

浏览 20提问于2020-12-15得票数 4

回答已采纳

2回答

BeautifulSoup不会从网页中提取所有表单

python、html、forms、web-scraping、beautifulsoup

我希望从一个给定的网站使用Python3和BeautifulSoup提取所有表单。下面是一个执行此操作的示例，但无法提取所有表单：from bs4 import BeautifulSoup for form in forms: print('\n\n') 如果您运行代码并访

浏览 0提问于2017-03-27得票数 2

5回答

如何从其他网站获取数据？

python、database、parsing、web-scraping

我想创建一个网站，从其他网站提取信息，并将它们打印到我的网站上，我正在进行研究，所以我想听取一些意见，这个项目的最佳解决方案是什么？我听说Python使用解析器可以做到这一点，我只是想知道我应该走哪条路，应该使用哪种语言？

浏览 1提问于2013-06-14得票数 4

2回答

将抓取的数据写入csv文件

python、web-scraping、beautifulsoup

我使用下面的代码从求职站点抓取数据，并使用BeautifulSoup将其写入csv文件。我看到抓取代码是有效的，因为当我打印提取的文件时，它看起来没有问题。但是，我无法将抓取的数据打印到csv文件中。创建了一个csv文件，但在每一列中，只有一些字母，如a，b，c，而不是描述头衔，薪水等的完整单词。有人可以帮助我吗？import requestsr=requests.get("https:/&

浏览 30提问于2021-02-26得票数 0

回答已采纳

1回答

BeautifulSoup请求从LinkedIn.com/jobs返回一个空列表

python、html、web-scraping、beautifulsoup、python-requests

我是BeautifulSoup和网络刮擦新手，所以请和我一起裸露一下。from bs4 import BeautifulSoup import

浏览 5提问于2022-04-28得票数 0

9回答

BeautifulSoup和Scrapy crawler有什么区别？

python、beautifulsoup、scrapy、web-crawler

我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云