为什么python输出与目标网站的html不匹配

文章/答案/技术大牛

发布

1回答

python、html、web-scraping、beautifulsoup

我试着在网上抓取一个目标网站，上面有产品的详细信息，比如价格、名称、jpeg等，但是通过python使用漂亮汤得到的信息似乎与目标网站(使用F12)中的html不匹配。我尝试过在beautifulsoup函数中使用html.parser和lxml，但这两者似乎没有什么不同。我试着在谷歌上搜索类似的问题，但没有找到任何东西。我使用atom运行python</

浏览 12提问于2019-06-25得票数 1

回答已采纳

1回答

使用Google代码在'postMessage‘上执行'DOMWindow’失败

javascript、html、google-plus、badge

('null')与收件人窗口的原产地('null')不匹配。人物未能在‘DOMWindow’上执行'postMessage‘：提供的<

浏览 2提问于2016-04-26得票数 1

回答已采纳

1回答

姜戈BeautifulSoup FeatureNotFound

python、django、beautifulsoup

当尝试用Django使用BeautifulSoup刮一些东西时，它会返回：urlContent = urllib2.urlopen(url).read() 我尝试过不同的导入方式我在树桩上，我不知道这是什么，也不知道为什么。在.py中测试它时工作

浏览 2提问于2014-09-06得票数 0

回答已采纳

1回答

使用BeautifulSoup抓取的数据与源代码不匹配

python、web-scraping、beautifulsoup、mismatch

我是网络抓取的新手。我已经看过一些关于如何使用漂亮的汤来抓取网站的教程。作为练习，我想从一个房地产网站上提取数据。我想要抓取的特定页面是这个：我遇到的第一个问题是，使用经典的漂亮汤代码抓取的数据与网页<em

浏览 4提问于2021-05-02得票数 1

1回答

涉及unicode的Django正则表达式混淆

regex、django、beautifulsoup

我们有一个奇怪的错误，我们追踪到了下面这个我们不明白的地方。如果我们在标准Python提示符中发出以下命令：print re.match("&#([0-9]+)[^0-9]","»") 我们得到了None的输出，正如我们所期望的那样但是，当我们将这段代码放入sgmllib.py ( Django最终通过我们的网站调用长串调用)时，Python确

浏览 0提问于2012-07-02得票数 0

1回答

抓取整个网站的图片URL

python、web-scraping

一位客户聘请我来收集网站上的图片列表。数据库乱七八糟，图片到处都是(一些在S3上，一些在本地服务器上)。我需要产生一个图像列表，我们将从S3迁移到新的托管公司，我们正在移动网站。我已经尝试使用REGEXP爬行数据库转储，但我提出的镜像列表与站点实际使用的镜像列表不匹配。我要做的是:释放一个蟒蛇脚本爬行的所有图像网址的整个网站。该网站是WordP

浏览 0提问于2017-03-28得票数 1

1回答

regex匹配并不像我预期的那样。

java、regex

在下面给定的匹配中:为什么第一次匹配会给出输出.在第二场比赛中，为什么“-”与目标不匹配？？(6,6:*)(7,7:+)(8,8:()(9,9:))(10,10:|)谢谢你问我的代码请在这里找到代码：

浏览 1提问于2015-07-06得票数 0

回答已采纳

1回答

在Apache mod重写规则中使用特殊字符

apache-2.2、mod-rewrite

我们正在努力清理我们网站上的404's，还有一些网站正在链接到/page.html%C2%A0。我正在尝试将url与mod重写匹配，并将其重定向到/page.html这似乎与url不匹配，我也尝试将百分比符号转义为\%，但这也不</e

浏览 0提问于2010-11-15得票数 0

回答已采纳

1回答

我正在设置2个kafka簇之间的镜子制造器。卡夫卡版本：kafka_2.11-2.1.0 我的server.properties有auto.create.topics.enable=true。我正在我的目标集群上运行mirror maker。但是当源集群添加一个主题时，新的主题不会自动创建。我最终不得不手动创建它们。即使在手动创建之后，源集群中的记录也不会在这个新主题中填充，直到或除非我重新启动我的镜像生成器。一旦重新启动，它将在源上插入数据后立即开始复制。 Mir

浏览 8提问于2019-03-03得票数 0

1回答

R:使用rvest和purrr:map_df构建一个数据框架:如何处理不完全输入

r、rvest、purrr

我遇到的问题是，并不是所有的网页都有我指定的每个html_nodes上的内容，而map_df忽略了这些不完整的网页。我希望map_df包含上述网页，并在NA与内容不匹配的地方编写html_nodes。"#History") %>% html_text()})这是输出：# A t

浏览 1提问于2019-05-02得票数 1

回答已采纳

1回答

Python正则表达式索引

python、regex

只是想确认一下这一点，但是正则表达式的索引/位置号似乎不遵循python其余部分中使用的相同规则。='<HTML>'>"<HTML>"[6] File "<

浏览 2提问于2016-08-26得票数 1

回答已采纳

1回答

我在php中的regexp没有正常工作，但是在RegexPal.com上工作。

php、regex

当在名为"ugh.php“的php文件中运行下面的代码时，我得到以下输出：YES, match: 123 <- This- This is NOT correctYES, match: 1234 <-This is correct rexexp的目标是允许在html表单字段中输入货币(只有整美元，逗号是可选的<

浏览 1提问于2016-02-10得票数 2

回答已采纳

3回答

当图像位于目标元素内时，ClientRect高度错误

javascript

我有一个简单的html： <a href='#' id='target'></a> 我想要获取#target

浏览 33提问于2019-04-11得票数 1

2回答

python和机械化登录大学网页

python、mechanize、login-script

我知道有相当多的人问了类似的问题，但在看了答案并遵循这些提示后，我无法让这个脚本工作……问题是访问上述网页并登录...这是登录网站：在最后你会看到我需要填写的表格...以下是我尝试使用的代码，以便登录并获得余额递减的

浏览 0提问于2012-04-07得票数 0

1回答

在拍卖网站上发布对象时获取通知

php、time、screen-scraping

我试图编写一些程序，每小时左右在拍卖网站上查找一些搜索查询，并在发布与搜索查询匹配的新对象时向我发送通知(例如电子邮件)。我试图为这个网站做这件事：提前感谢

浏览 3提问于2016-04-06得票数 0

回答已采纳

1回答

如何在Go中迭代[]map[string]接口{}以生成html表

go、go-html-template

我试图使用html/template在Go中生成一个HTML内容。数据实际上是来自不同SELECT表的MySQL查询的输出。能够生成，但无法拆分行。列和行不匹配这里是操场链接，它的样本数据与我的用例相匹配。下面是<

浏览 3提问于2022-07-26得票数 0

回答已采纳

2回答

Google Analytics -正则表达式目标URL与页面视图不匹配

regex、url、google-analytics

出于某些原因-我的目标URL页面加载与我在Google Analytics中跟踪的总体目标不匹配。?enquiry_senturls与?enquiry_sent的唯一页面加载都在谷歌分析中，但只是没有注册为目标</em

浏览 0提问于2013-03-14得票数 0

1回答

运行Grunt构建不会编译jade文件

yeoman、grunt-contrib-jade

我实现了Jade模板引擎，Yeoman-AngularJS应用，它在我的本地运行得很好。但在部署它时，运行Grunt Build不会编译.jade文件。这就是为什么我在生产环境中得到一个错误的Cannot GET /。

浏览 1提问于2015-03-25得票数 0

1回答

扫描网络时可能出现的误报- X509证书错配

vulnerability-scanners、x.509

调查结果的标题是：下面，我增加了关于扫描结果的更多细节(以区块引号)，并在下面提供了我的评论。从研究和审查指标来看，我认为这是一个假阳性，原因如下(请注意，我已更改了域名)： Subject CN *.somedomain.com与站点中指定的目标名称不匹配。站点是指在扫描配置中给资产指定的名称。在这种情况下，所有资产都由其I

浏览 0提问于2018-01-24得票数 4

回答已采纳

2回答

Python无法将值与列表元素进行比较。

python、python-3.x、list、function、range

所以我对python比较陌生，不知道这里出了什么问题？我确信这是我缺少的一个基本的东西，但不确定它可能是什么，下面是寻找与列表中任何一个数字相匹配的目标的代码，它应该根据我的要求工作，但不能。input() print(g) main() 下面是输出，它显然返回0

浏览 0提问于2021-03-05得票数 0

回答已采纳

点击加载更多