腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
python
输出
与
目标
网站
的
html
不
匹配
python
、
html
、
web-scraping
、
beautifulsoup
我试着在网上抓取一个
目标
网站
,上面有产品
的
详细信息,比如价格、名称、jpeg等,但是通过
python
使用漂亮汤得到
的
信息似乎
与
目标
网站
(使用F12)中
的
html
不
匹配
。我尝试过在beautifulsoup函数中使用
html
.parser和lxml,但这两者似乎没有什么不同。我试着在谷歌上搜索类似的问题,但没有找到任何东西。我使用atom运行
python</
浏览 12
提问于2019-06-25
得票数 1
回答已采纳
1
回答
使用Google代码在'postMessage‘上执行'DOMWindow’失败
javascript
、
html
、
google-plus
、
badge
('null')
与
收件人窗口
的
原产地('null')
不
匹配
。人物 未能在‘DOMWindow’上执行'postMessage‘:提供
的<
浏览 2
提问于2016-04-26
得票数 1
回答已采纳
1
回答
姜戈BeautifulSoup FeatureNotFound
python
、
django
、
beautifulsoup
当尝试用Django使用BeautifulSoup刮一些东西时,它会返回:urlContent = urllib2.urlopen(url).read() 我尝试过不同
的
导入方式我在树桩上,我不知道这是什么,也不知道
为什么
。在.py中测试它时工作
浏览 2
提问于2014-09-06
得票数 0
回答已采纳
1
回答
使用BeautifulSoup抓取
的
数据
与
源代码
不
匹配
python
、
web-scraping
、
beautifulsoup
、
mismatch
我是网络抓取
的
新手。我已经看过一些关于如何使用漂亮
的
汤来抓取
网站
的
教程。作为练习,我想从一个房地产
网站
上提取数据。我想要抓取
的
特定页面是这个:我遇到
的
第一个问题是,使用经典
的
漂亮汤代码抓取
的
数据
与
网页<em
浏览 4
提问于2021-05-02
得票数 1
1
回答
涉及unicode
的
Django正则表达式混淆
regex
、
django
、
beautifulsoup
我们有一个奇怪
的
错误,我们追踪到了下面这个我们不明白
的
地方。如果我们在标准
Python
提示符中发出以下命令:print re.match("&#([0-9]+)[^0-9]","»") 我们得到了None
的
输出
,正如我们所期望
的
那样但是,当我们将这段代码放入sgmllib.py ( Django最终通过我们
的
网站
调用长串调用)时,
Python
确
浏览 0
提问于2012-07-02
得票数 0
1
回答
抓取整个
网站
的
图片URL
python
、
web-scraping
一位客户聘请我来收集
网站
上
的
图片列表。数据库乱七八糟,图片到处都是(一些在S3上,一些在本地服务器上)。我需要产生一个图像列表,我们将从S3迁移到新
的
托管公司,我们正在移动
网站
。我已经尝试使用REGEXP爬行数据库转储,但我提出
的
镜像列表
与
站点实际使用
的
镜像列表
不
匹配
。 我要做
的
是:释放一个蟒蛇脚本爬行
的
所有图像网址
的
整个
网站
。该
网站
是WordP
浏览 0
提问于2017-03-28
得票数 1
1
回答
regex
匹配
并不像我预期
的
那样。
java
、
regex
在下面给定
的
匹配
中:
为什么
第一次
匹配
会给出
输出
.在第二场比赛中,
为什么
“-”
与
目标
不
匹配
??(6,6:*)(7,7:+)(8,8:()(9,9:))(10,10:|)谢谢你问我
的
代码 请在这里找到代码:
浏览 1
提问于2015-07-06
得票数 0
回答已采纳
1
回答
在Apache mod重写规则中使用特殊字符
apache-2.2
、
mod-rewrite
我们正在努力清理我们
网站
上
的
404's,还有一些
网站
正在链接到/page.
html
%C2%A0。我正在尝试将url
与
mod重写
匹配
,并将其重定向到/page.
html
这似乎
与
url
不
匹配
,我也尝试将百分比符号转义为\%,但这也
不</e
浏览 0
提问于2010-11-15
得票数 0
回答已采纳
1
回答
Mirror Maker不自动生成主题
apache-kafka
我正在设置2个kafka簇之间
的
镜子制造器。 卡夫卡版本:kafka_2.11-2.1.0 我
的
server.properties有auto.create.topics.enable=true。我正在我
的
目标
集群上运行mirror maker。 但是当源集群添加一个主题时,新
的
主题不会自动创建。我最终不得不手动创建它们。即使在手动创建之后,源集群中
的
记录也不会在这个新主题中填充,直到或除非我重新启动我
的
镜像生成器。一旦重新启动,它将在源上插入数据后立即开始复制。 Mir
浏览 8
提问于2019-03-03
得票数 0
1
回答
R:使用rvest和purrr:map_df构建一个数据框架:如何处理不完全输入
r
、
rvest
、
purrr
我遇到
的
问题是,并不是所有的网页都有我指定
的
每个
html
_nodes上
的
内容,而map_df忽略了这些不完整
的
网页。我希望map_df包含上述网页,并在NA
与
内容
不
匹配
的
地方编写
html
_nodes。"#History") %>%
html
_text()})这是
输出
:# A t
浏览 1
提问于2019-05-02
得票数 1
回答已采纳
1
回答
Python
正则表达式索引
python
、
regex
只是想确认一下这一点,但是正则表达式
的
索引/位置号似乎
不
遵循
python
其余部分中使用
的
相同规则。='<
HTML
>'>"<
HTML
>"[6] File "<
浏览 2
提问于2016-08-26
得票数 1
回答已采纳
1
回答
我在php中
的
regexp没有正常工作,但是在RegexPal.com上工作。
php
、
regex
当在名为"ugh.php“
的
php文件中运行下面的代码时,我得到以下
输出
:YES, match: 123 <- This- This is NOT correctYES, match: 1234 <-This is correct rexexp
的
目标
是允许在
html
表单字段中输入货币(只有整美元,逗号是可选
的<
浏览 1
提问于2016-02-10
得票数 2
回答已采纳
3
回答
当图像位于
目标
元素内时,ClientRect高度错误
javascript
我有一个简单
的
html
: <a href='#' id='target'></a> 我想要获取#target
浏览 33
提问于2019-04-11
得票数 1
2
回答
python
和机械化登录大学网页
python
、
mechanize
、
login-script
我知道有相当多的人问了类似的问题,但在看了答案并遵循这些提示后,我无法让这个脚本工作……问题是访问上述网页并登录...这是登录
网站
:在最后你会看到我需要填写
的
表格...以下是我尝试使用
的
代码,以便登录并获得余额递减
的
浏览 0
提问于2012-04-07
得票数 0
1
回答
在拍卖
网站
上发布对象时获取通知
php
、
time
、
screen-scraping
我试图编写一些程序,每小时左右在拍卖
网站
上查找一些搜索查询,并在发布
与
搜索查询
匹配
的
新对象时向我发送通知(例如电子邮件)。我试图为这个
网站
做这件事:提前感谢
浏览 3
提问于2016-04-06
得票数 0
回答已采纳
1
回答
如何在Go中迭代[]map[string]接口{}以生成
html
表
go
、
go-html-template
我试图使用
html
/template在Go中生成一个
HTML
内容。数据实际上是来自不同SELECT表
的
MySQL查询
的
输出
。能够生成,但无法拆分行。列和行
不
匹配
这里是操场链接,它
的
样本数据与我
的
用例相
匹配
。下面是<
浏览 3
提问于2022-07-26
得票数 0
回答已采纳
2
回答
Google Analytics -正则表达式
目标
URL
与
页面视图
不
匹配
regex
、
url
、
google-analytics
出于某些原因-我
的
目标
URL页面加载与我在Google Analytics中跟踪
的
总体
目标
不
匹配
。?enquiry_senturls
与
?enquiry_sent
的
唯一页面加载都在谷歌分析中,但只是没有注册为
目标</em
浏览 0
提问于2013-03-14
得票数 0
1
回答
运行Grunt构建不会编译jade文件
yeoman
、
grunt-contrib-jade
我实现了Jade模板引擎,Yeoman-AngularJS应用,它在我
的
本地运行得很好。 但在部署它时,运行Grunt Build不会编译.jade文件。这就是
为什么
我在生产环境中得到一个错误
的
Cannot GET /。
浏览 1
提问于2015-03-25
得票数 0
1
回答
扫描网络时可能出现
的
误报- X509证书错配
vulnerability-scanners
、
x.509
调查结果
的
标题是:下面,我增加了关于扫描结果
的
更多细节(以区块引号),并在下面提供了我
的
评论。从研究和审查指标来看,我认为这是一个假阳性,原因如下(请注意,我已更改了域名): Subject CN *.somedomain.com
与
站点中指定
的
目标
名称
不
匹配
。站点是指在扫描配置中给资产指定
的
名称。在这种情况下,所有资产都由其I
浏览 0
提问于2018-01-24
得票数 4
回答已采纳
2
回答
Python
无法将值
与
列表元素进行比较。
python
、
python-3.x
、
list
、
function
、
range
所以我对
python
比较陌生,不知道这里出了什么问题?我确信这是我缺少
的
一个基本
的
东西,但不确定它可能是什么,下面是寻找
与
列表中任何一个数字相
匹配
的
目标
的代码,它应该根据我
的
要求工作,但不能。input() print(g) main() 下面是
输出
,它显然返回0
浏览 0
提问于2021-03-05
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫实现的微信公众号文章下载器
使用Python进行网页内容巡检:保障信息准确性与一致性
爬虫?这些你都知道么?
python爬虫:散文网站内容抓取实战案例附源码
Python 爬虫之网络小说下载
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券