腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
BeautifulSoup
从
抓取
后
提取
单词
python
、
web
、
url
、
beautifulsoup
我在网页上
使用
BeautifulSoup
4收集了一些信息:https://www.peakbagger.com/list.aspx?lid=5651 from urllib.request import urlopenimport pandas as pd html = urlopen(url) soup =
BeautifulSoup
(html, 'html.parser
浏览 21
提问于2021-09-28
得票数 0
回答已采纳
2
回答
从
word河马中进行网络
抓取
python-3.x
、
web-scraping
、
beautifulsoup
我有一个关于
从
单词
河马中
抓取
单词
的问题。我对Beautiful Soup是个新手,不知道如何获取这个
单词
列表(如下所述) 我正在尝试获取页面以下部分下的所有同义词(甚至是“更多”按钮下的那些同义词。 第1节 ? 第2节 ? #My code.from bs4 import
BeautifulSoup
response = requests.get("https://www.wordhippo.com/
浏览 38
提问于2021-01-24
得票数 1
回答已采纳
1
回答
未
使用
python正确检索csv文件中的信息
python
、
web-scraping
、
beautifulsoup
我正在从这个中
抓取
一些内容。在从csv文件中
提取
站点
后
,像会议负责人一样书写时,名字不会正确出现,例如,如果
单词
是microsoft,它会以osoft出现,但其余所有
单词
都会正确出现import csvfrom bs4 import
BeautifulSoup
a = csv.writer(a.writer
浏览 3
提问于2016-03-03
得票数 0
3
回答
Python -
抓取
谷歌的简单方法,为给定的搜索下载前N个命中结果(整个.html文档)?
python
、
web-scraping
、
urllib2
、
google-search
有没有一种简单的方法来
抓取
谷歌,并为给定的搜索写出前N个(比如说1000个) .html (或其他任何)文档的文本(只是文本)?我假设这将
使用
urllib2库?如果有帮助的话,我会
使用
Python 3.1。
浏览 2
提问于2011-03-16
得票数 10
回答已采纳
1
回答
如何配置Scrapy以
使用
BeautifulSoup
解析器
python
、
web-scraping
、
beautifulsoup
、
scrapy
我
使用
BeautifulSoup
的默认html.parser
从
任何网页中
提取
数据,没有什么原因让我觉得它比
使用
XPATH/CSS选择器更灵活、更强大。在
抓取
之前,我学习了
使用
BeautifulSoup
进行网络
抓取
。我想不出一种让Scrapy
使用
bs4作为解析器的方法。有可能吗?
浏览 2
提问于2019-08-18
得票数 0
回答已采纳
1
回答
Python如何
抓取
图像、文本和指向音频文件url的链接
python
、
python-3.x
、
xpath
、
web-scraping
我正在尝试
从
以下url (http://www.ancient-hebrew.org/m/dictionary/1000.html)中
抓取
数据。例如,url中的第一个条目是"img1 img2 img3אֶלֶףe-leph“希伯来语
单词
是
使用
wget下载html
后
的unicode。我正在尝试按顺序收集这些信息,以便首先获得图像文件,然后是希伯来语
单词
,然后是发音。最后,我想找到音频文件的URL。 而且,每个
单词</em
浏览 16
提问于2019-06-11
得票数 2
3
回答
如何
使用
正则表达式获取同时包含空格和字符的文本?
python
、
regex
、
web-scraping
我
使用
正则表达式仅获取国家名称,但是省略了包含空格的国家名称(刚果、韩国、英国等)。import requestsfrom bs4 import
BeautifulSoup
soup =
BeautifulSoup
(pop.text, "html.p
浏览 1
提问于2020-08-01
得票数 1
2
回答
尝试
从
同一下拉菜单下载多个文件- Python Selenium Chromedriver
python-3.x
、
selenium
、
selenium-webdriver
、
selenium-chromedriver
我在尝试
使用
Selenium Chromedriver
从
网站上的同一下拉菜单下载两个单独的文件时遇到了问题。 我有代码来单击这两个链接,但它只确认第一个链接;第二个文件不会被下载。我知道,当我不
使用
webdriver时,我可以同时进行多个下载,所以可能问题是chromedriver一次只允许一个下载?我没有把握。for shapefile download ###ShapefileLink.click()
浏览 25
提问于2020-09-09
得票数 1
回答已采纳
1
回答
Python web
抓取
: google搜索结果中的网站
python
、
html
、
web-scraping
、
web-crawler
、
google-crawlers
我想从一个谷歌搜索页面
从
多个网站(例如100+)
提取
信息。我只想
提取
关键信息,例如那些带有<h1>、<h2>或<b>或<li> HTML标签的信息等,但我不想
提取
整个段落的<p>。我知道如何
从
google搜索中收集网站URL列表;我还知道如何在查看页面的HTML
后
对单个网站进行网络
抓取
。我
使用
Request和
BeautifulSoup
来完成这些任务。但是,我想知道如何
浏览 18
提问于2021-03-31
得票数 1
1
回答
当[' href ']元素是超链接时如何
提取
href
python
、
beautifulsoup
、
onclick
、
href
我正在尝试
从
网页中
抓取
数据,然后通过
提取
下一页的href来转到下一页。r = requests.get(url) 我
使用
findAll()函数来获取
浏览 1
提问于2020-01-08
得票数 1
1
回答
如何正确地
从
带有utf8的网页中
提取
BeautifulSoup
4文本(日语符号)
python
、
utf-8
、
beautifulsoup
现在我正在尝试从这些页面中
提取
我需要的一些数据。问题在于这些数据中包含的日语
单词
。英语
单词
的
提取
非常完美。section.get_text(strip=True) 还有一些,我也尝试用URLencoding对生成的文本进行编码奇怪(但并不完全)的方法之一是将字符串保存
浏览 2
提问于2019-10-07
得票数 3
1
回答
用
BeautifulSoup
- HTML不同格式
从
CSS类链接中
提取
标题
python
、
beautifulsoup
我刚开始
使用
BeautifulSoup
进行网络
抓取
,并遇到了以下问题:我试图
从
论坛上
抓取
帖子,我想
提取
帖子的标签。如何
提取
“高级物理”?
浏览 5
提问于2021-06-08
得票数 0
回答已采纳
1
回答
无法
使用
regex刮取网站的某些值。
python
、
regex
、
python-2.7
、
web-scraping
print("Status: " + str(status))不幸的是,它只返回:"Status: []" 然而,尽管如此,我不知道我做错了什么,因为当我在同一个网站上测试时,我可以
使用
代码
浏览 2
提问于2014-05-15
得票数 0
回答已采纳
1
回答
通过IMAP
抓取
电子邮件HTML
python
、
html
、
web-scraping
、
beautifulsoup
、
imap
我正在尝试用
BeautifulSoup
编写一个
从
Gmail帐户的电子邮件中
抓取
html表格的工具。
使用
IMAP,脚本会间歇性地检查收件箱。不过,我不确定如何
从
电子邮件中
提取
HTML,这是
抓取
表格所需的。目前,它
提取
正文文本,而不是原始的HTML:items = ite
浏览 0
提问于2014-01-07
得票数 0
1
回答
解析python中的html值
python
、
html
、
beautifulsoup
:0px;background-color:#f3f3f3" type="submit" value="▾"/> </td> 我需要从value="25“和value="0”中
提取
两个数字
浏览 20
提问于2020-12-15
得票数 4
回答已采纳
2
回答
BeautifulSoup
不会
从
网页中
提取
所有表单
python
、
html
、
forms
、
web-scraping
、
beautifulsoup
我希望从一个给定的网站
使用
Python3和
BeautifulSoup
提取
所有表单。下面是一个执行此操作的示例,但无法
提取
所有表单:from bs4 import
BeautifulSoup
for form in forms: print('\n\n') 如果您运行代码并访
浏览 0
提问于2017-03-27
得票数 2
5
回答
如何
从
其他网站获取数据?
python
、
database
、
parsing
、
web-scraping
我想创建一个网站,
从
其他网站
提取
信息,并将它们打印到我的网站上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?我听说Python
使用
解析器可以做到这一点,我只是想知道我应该走哪条路,应该
使用
哪种语言?
浏览 1
提问于2013-06-14
得票数 4
2
回答
将
抓取
的数据写入csv文件
python
、
web-scraping
、
beautifulsoup
我
使用
下面的代码
从
求职站点
抓取
数据,并
使用
BeautifulSoup
将其写入csv文件。我看到
抓取
代码是有效的,因为当我打印
提取
的文件时,它看起来没有问题。但是,我无法将
抓取
的数据打印到csv文件中。创建了一个csv文件,但在每一列中,只有一些字母,如a,b,c,而不是描述头衔,薪水等的完整
单词
。有人可以帮助我吗?import requestsr=requests.get("https:/&
浏览 30
提问于2021-02-26
得票数 0
回答已采纳
1
回答
BeautifulSoup
请求
从
LinkedIn.com/jobs返回一个空列表
python
、
html
、
web-scraping
、
beautifulsoup
、
python-requests
我是
BeautifulSoup
和网络刮擦新手,所以请和我一起裸露一下。from bs4 import
BeautifulSoup
import
浏览 5
提问于2022-04-28
得票数 0
9
回答
BeautifulSoup
和Scrapy crawler有什么区别?
python
、
beautifulsoup
、
scrapy
、
web-crawler
我对
BeautifulSoup
比较熟悉,但对Scrapy crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
利用Python和Repl.it进行网页信息爬取
Python爬虫入门,快速抓取大规模数据
Python爬虫入门,快速抓取大规模数据2
使用多个Python库开发网页爬虫(一)
Python NLP入门教程
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券