腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
/
Python
解析
网站
的
问题
python
、
web-scraping
、
beautifulsoup
、
css-selectors
、
html-parsing
我相信这在过去可能会被问到,但我正在尝试
解析
一个
网站
(希望以某种方式自动
解析
最终一次
解析
多个
网站
),但它不能正常工作。我可能在获取合适
的
标签或其他东西时遇到了
问题
,但本质上我想去这个
网站
,从创建
的
列表中取出所有的项目(可能是完整
的
href,也可能是一个单独
的
文档),并将它们粘贴到一个文件中,我可以用一种易于阅读
的
格式分享它们到目前为止,这是我
的
代码: url =
浏览 16
提问于2020-10-16
得票数 0
1
回答
姜戈
BeautifulSoup
FeatureNotFound
python
、
django
、
beautifulsoup
当尝试用Django使用
BeautifulSoup
刮一些东西时,它会返回:urlContent = urllib2.urlopen(url).read() 我尝试过不同
的
导入方式: from bs4 import
BeautifulSoup</em
浏览 2
提问于2014-09-06
得票数 0
回答已采纳
2
回答
尝试将数据从
网站
加载到json文件中。
python
、
json
、
python-requests
我试图将数据从一个
网站
加载到一个json文件中。当我尝试这段代码时,没有什么
问题
:import json print(r.text)print(r.json) 上面的代码显示:响应200
的
绑定方法
浏览 2
提问于2020-05-10
得票数 0
1
回答
使用
BeautifulSoup
打印
网站
上
的
图像
python
、
web-scraping
、
beautifulsoup
我在
python
中练习使用
BeautifulSoup
,试图
解析
来自这个
网站
的
信息: from bs4 import
BeautifulSoup
source = requests.get('https://www.vogue.com/fashion/street-style'
浏览 3
提问于2020-06-05
得票数 0
回答已采纳
1
回答
如果内容包含一些字符串,如何使用
python
将内容与html标记一起删除
html
、
python-2.7
、
tags
我目前正在处理一些html格式
的
数据。这些文件
的
格式或多或少是这样
的
(请记住,为了简单起见,我已经删除了大部分内容,以便在线显示代码):<TITLE>some header here</TITLE><PRE>
浏览 2
提问于2018-03-19
得票数 0
2
回答
BS4返回[]而不是所需
的
HTML标记
python
、
html
、
parsing
、
beautifulsoup
我想要
解析
给定
的
网站
并抓取表。在我看来,代码看起来是正确
的
。
python
和web
解析
新手from bs4 import
BeautifulSoup
doc =
BeautifulSoup
(response.text, 'lxml-xml'
浏览 12
提问于2020-11-15
得票数 1
回答已采纳
1
回答
<script>标签和HTMLParseError
python
、
beautifulsoup
我试图用
BeautifulSoup
解析
超文本标记语言,却得到了奇怪
的
错误。下面是重现
问题
的
最小代码。(Windows 7 32位,ActivePython 2.7)。from bs4 import
BeautifulSoup
<html>var pstr = "<li><font color='blue'>1</font>&
浏览 4
提问于2012-05-05
得票数 1
回答已采纳
3
回答
无法使用
Python
和
BeautifulSoup
解析
网站
的
html
python
、
html
、
beautifulsoup
我正在尝试从
网站
收集href (),使用
python
和
BeautifulSoup
模块。但由于某种原因,我无法
解析
特定
的
html数据。这个
问题
的
解决办法是什么?提前谢谢!这是我
的
密码soup =
BeautifulSoup
(
浏览 7
提问于2020-07-15
得票数 0
3
回答
用
python
刮
网站
python
、
web-scraping
、
beautifulsoup
、
scrapy
、
libraries
我试图在网上刮一个
网站
,以获取价格和标题从它。我已经看过多个教程和博客,最常见
的
库是漂亮汤和scrapy。如果有一种方法可以在不使用任何第三方库(如
beautifulsoup
和scrapy )
的
情况下抓取一个
网站
,那么就可以使用
beautifulsoup
。
浏览 1
提问于2020-06-09
得票数 1
回答已采纳
1
回答
如何用
Python
中
的
BeautifulSoup
解析
多体标记中
的
文本?
python
、
html
、
beautifulsoup
我想
解析
这个
网站
:<span class="sharenumber" id="fb_share_span">2830</span>from bs4 import
BeautifulSoup
res = requests.get("https:/
浏览 2
提问于2015-12-20
得票数 2
回答已采纳
3
回答
如何消除
BeautifulSoup
用户警告?
python
、
beautifulsoup
安装
BeautifulSoup
后,每当我在命令行中运行
Python
时,就会发出以下警告:
BeautifulSoup
([your
浏览 4
提问于2015-11-04
得票数 67
回答已采纳
2
回答
使用机械化进行以下链接
python
、
web-scraping
、
beautifulsoup
、
mechanize
我想使用机械化
python
库来跟踪
网站
中
的
某些链接,但我唯一感兴趣
的
链接是<div>标记中
的
链接。
问题
是相关
的
,但他们是使用lxml
解析
器实现
的
,我不熟悉这个
解析
器,我更习惯使用
BeautifulSoup
。我已经使用
BeautifulSoup
找到了相关链接,但我不知道如何使用Mechanize (或其他东西)来跟踪这些链接。有没有办法把一个字符串传递给机械化,这样它就会
浏览 0
提问于2013-01-24
得票数 2
回答已采纳
2
回答
Python
:从TD标记中打印特定
的
文本行
python
、
parsing
、
iteration
、
beautifulsoup
我相信这是一个简单
的
问题
。我正在
解析
一个
网站
,我试图在标签之间获得特定
的
文本。文本将== revoked,Active,Default I am using
Python
。我已经能够打印出所有的内部文本结果,但我还无法在web上找到针对特定文本
的
良好解决方案。以下是我
的
代码import urllib2 url =
浏览 0
提问于2013-05-28
得票数 0
回答已采纳
1
回答
根据条件合并多个xml文件
xml
、
language-agnostic
我有一个xml文件,是每周收到
的
。该文件包含我
的
客户可用
的
大约40个“活动”。在这40个活动中,我只需要8个。为了减少处理文件
的
时间,我需要选择8个“活动”,然后将它们组合到一个xml文件中。当我将文件完全展开时,我们有大约1.5 we
的
行。这就是为什么我急于限制我必须处理
的
内容。我
的
一个同事编写了一个java脚本,为树中
的
每个活动创建一个新
的
xml文件。生成
的
文件类似于123456.xml。 从这里开始,我需要做<
浏览 0
提问于2014-02-18
得票数 0
10
回答
使用
Python
进行Web抓取
python
、
firefox
、
webkit
、
web-scraping
我目前正在尝试抓取一个HTML格式相当差
的
网站
(通常缺少结束标记,没有使用类或it,因此很难直接转到您想要
的
元素,等等)。到目前为止,我使用
BeautifulSoup
已经取得了一些成功,但偶尔(尽管很少),我会遇到一个页面,在这个页面上,
BeautifulSoup
创建
的
HTML树与(例如) Firefox或Webkit略有不同虽然这是可以理解
的
,因为HTML
的
格式使这种模棱两可,如果我能够得到与Firefox或Webkit生成
的
相同<
浏览 3
提问于2010-03-08
得票数 9
回答已采纳
4
回答
设置一个可以在Google App engine上工作
的
python
屏幕抓取器
python
、
google-app-engine
、
screen-scraping
我希望设置一个自动屏幕刮板,将运行在谷歌应用程序引擎使用
python
。我想让它抓取
网站
,并将指定
的
结果放入应用程序引擎
的
实体中。我正在寻找一些关于使用
的
说明。我看过漂亮
的
汤,但不知道人们是否可以推荐其他可以在Google App engine上运行
的
东西。
浏览 1
提问于2010-03-09
得票数 3
回答已采纳
1
回答
如何使用
BeautifulSoup
从表中获得第一个和第三个td?
python
、
html
、
html-table
、
beautifulsoup
、
html-parsing
我目前正在使用
Python
和
BeautifulSoup
来抓取一些
网站
数据。我试图从格式化如下
的
表中提取单元格:上面的HTML
的
问题
是,
BeautifulSoup
将它作为一个标记读取不幸
的</e
浏览 0
提问于2013-08-14
得票数 6
回答已采纳
2
回答
html文件中两个字符串之间
的
Bash Grep
bash
、
awk
、
sed
、
grep
、
html
=<br>)' 但是我
的
输出还没有完成。
浏览 0
提问于2021-01-25
得票数 1
1
回答
如何使PHP识别本地安装
的
Python
模块以执行
Python
脚本
php
、
python
、
html
、
apache
、
web-services
我有以下
Python
代码,稍后将使用PHP调用这些代码:"""Code name: test.py"""myargs = sys.argv[1是在本地安装
的
:/home/pdubois/.local/lib/
pytho
浏览 1
提问于2014-06-03
得票数 0
回答已采纳
1
回答
用
BeautifulSoup
超链接访问表格数据
python
、
html
、
parsing
、
web-scraping
、
beautifulsoup
对于使用
BeautifulSoup
,我仍然有一些不理解
的
地方。我可以用它来
解析
网页
的
原始HTML,这里是"example_website.com":for link in soup.find_all('a'):我不明白
的
是:我
浏览 2
提问于2015-10-14
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫之BeautifulSoup解析之路
python爬虫-解析网页的几种方法之BeautifulSoup
如何使用Python和BeautifulSoup爬取网站
Python爬虫库-BeautifulSoup的使用
Python3使用BeautifulSoup解析百度关键词搜索结果
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券