腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
Web
抓取
脚本
返回
重复
的
值
python-3.x
、
web-scraping
、
beautifulsoup
、
python-requests
、
tags
我
的
网页
抓取
脚本
由于某种原因
返回
重复
的
结果,我尝试了这么多替代方案,但就是不能让它工作。有谁能帮帮忙吗?('no-name') csv_writer.writerow([business, names]) csv_file.close() 它当前在all上
返回
重复
的
值
它需要做
的
是为每个url调用
返回
一个'
浏览 26
提问于2019-05-15
得票数 1
回答已采纳
1
回答
值
的
Web
抓取
器
重复
python
、
web
、
web-scraping
、
beautifulsoup
、
python-requests
网络摩天大楼
的
目标是收集产品信息,大小,in等。我已经把一切都做对了,除了size和psizeID只是第一个产品data.Can
的
重复
,有人能给我指出正确
的
方向吗?我是不是错过了史密斯。
浏览 12
提问于2021-06-24
得票数 0
3
回答
计算字符串在文件perl中
重复
的
次数
perl
、
file
顺便说一句,我是Perl
的
新手。我有一个Perl
脚本
,它需要计算字符串在文件中出现
的
次数。
脚本
从文件本身获取单词。 我需要它来
抓取
文件中
的
第一个单词,然后搜索文件
的
其余部分,看看它是否在其他地方
重复
。如果
重复
,我需要它
返回
重复
的
次数。如果没有
重复
,则可以
返回
0。我需要它来获取文件中
的
下一个单词,并再次检查此内容。我将从文件中<e
浏览 2
提问于2011-04-07
得票数 0
回答已采纳
1
回答
Web
抓取
:
返回
以前
的
值
php
、
web-scraping
、
file-get-contents
、
simple-html-dom
我正在尝试获取板球
的
比分(它会实时更新),为了获取比分,我使用了HTML dom解析器。除了
重复
以前
的
值
之外,一切都运行得很好。有时,它会获取已经获取
的
前一个分数。像这样
的
东西 10分,15分,10分(
重复
),15分(
重复
) 我做了很多研究,尝试了很多不同
的
方法来解决这个问题,但都没有结果。
浏览 23
提问于2021-10-10
得票数 1
2
回答
Web
抓取
脚本
返回
和空列表
python
、
web-scraping
、
python-requests
我正在尝试写我
的
第一个测试网站
的
网络刮板。它涉及到登录,我遵循了一个关于如何处理这种情况
的
教程。html.fromstring(result.text)
浏览 29
提问于2019-01-21
得票数 1
1
回答
lxml
web
抓取
返回
空
值
python-3.x
、
web-scraping
、
lxml
我正在尝试从这个网站获取所有的食物类别https://www.walmart.com/cp/976759这里是类别容器
的
快照 <div id="cp-center-module-5" class=categorypage-FeaturedCategoriesCollapsible-SeeAllCategoriesButton">Shop All</a></div></div></div> 这是我<em
浏览 26
提问于2020-07-25
得票数 0
回答已采纳
1
回答
抓取
Web
的
返回
值
405
web-scraping
我用python在Scrapy中做了一个简单
的
爬虫,从一些网站获取标题。我得到了这个405错误,可以在一个网站
的
照片中看到,另一个很好,它
返回
了200。你知道问题出在哪里吗?如果你能给我一个完整
的
答案或只是一些链接,我将不胜感激。它与这里链接
的
内容不同,因为我遇到了验证码...
浏览 1
提问于2018-12-01
得票数 0
1
回答
抓取
web
page_python时避免
重复
单词
python
、
web-scraping
我从列表(我
的
df转换为包含
重复
单词
的
列表
的
列)中
抓取
一个网页元素,并将结果
返回
到df中。我需要在
抓取
时找到排除
重复
的
方法(以减少时间),但同时在
重复
的
情况下,我需要为所有
重复
的
单词填充导出
值
。string3 Yesstring1 Yes string4
浏览 15
提问于2021-01-13
得票数 2
回答已采纳
2
回答
Web
抓取
站点未
返回
正确
的
值
python
、
web-scraping
、
beautifulsoup
、
python-requests
我正在
抓取
的
site。我
的
目标是
抓取
产品ID/sku并获得链接。但是这些元素在站点中,当我
抓取
数据时,我
的
输出将是空白/错误。
浏览 24
提问于2021-06-27
得票数 1
1
回答
如何简化/自动化数据输入?
database
、
web
我希望创建一个网站周围
的
工具,从不同
的
网站插入到我
的
表单信息。我想取消/简化数据输入。有谁知道完成这项任务
的
好方法吗?
浏览 0
提问于2016-04-19
得票数 1
1
回答
如何知道在
抓取
时使用哪些标签?
python-3.x
、
web-scraping
抓取
时有没有使用哪些标签
的
逻辑?现在,我只是在对不同
的
标签变体进行“反复试验”,看看哪种标签是有效
的
。这需要很多时间,而且真的很令人沮丧。我不能理解为什么有些标签能工作,有些不能。test2 = soup.find_all('div', attrs={'id':'YDC-Lead-Stack-Composite'})为什么第一个例子(test1)
返回
值
,第二个例子(test2)没有
返回</em
浏览 0
提问于2020-05-25
得票数 0
1
回答
Anki
的
Web
抓取
脚本
python
、
anki
学习python可以加快我使用Anki学习语言
的
速度。我想为Anki创建网页
抓取
脚本
,以便更快地创建卡片。这是我
的
代码:(这不是最终
的
产品,我最终想学习如何发送到csv文件,以便我可以导入到Anki。)partofspeech.text) f.write(IPA.text)f.close() 它只
返回
来自Wikitionnaire
的
“每日词汇”,而不是用户<
浏览 20
提问于2020-09-11
得票数 3
1
回答
验证来自cURL
的
完整响应
php
、
curl
、
web-scraping
有时,当使用多个并发连接和
抓取
我
的
PHP
脚本
中
的
cURL时,会
返回
不完整
的
网页。curl_getinfo()中有没有一些
值
可以让我知道一个网页是100%被
抓取
还是只有90%被
抓取
?
返回
页面的内容大小标题是
返回
内容
的
实际大小,还是整个页面的大小?如果是这样,我可以根据响应
的
实际大小检查content-size。 谢谢!
浏览 0
提问于2013-04-12
得票数 0
回答已采纳
1
回答
web
抓取
阻止
脚本
访问
的
web
python
、
web-scraping
我曾经使用python
脚本
(urllib)来
抓取
一个网站。现在看来,该网站正在阻止我
的
请求,每当我使用
脚本
请求一个网页时,我就会得到一个带有一些JS
的
html,但是没有通常
的
数据。从我
的
浏览器访问网站工作得很好。我试着更改“用户代理”,以适应我
的
浏览器使用
的
用户代理,但这并没有帮助。我观察到
的
一个奇怪
的
行为是,在从浏览器访问页面之后,我也可以从
脚本
中访问它。所以我
的</em
浏览 5
提问于2014-11-04
得票数 1
回答已采纳
5
回答
如何从其他网站获取数据?
python
、
database
、
parsing
、
web-scraping
我想创建一个网站,从其他网站提取信息,并将它们打印到我
的
网站上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?
浏览 1
提问于2013-06-14
得票数 4
1
回答
是什么导致我不断打电话给我
的
电报网钩?
telegram
、
botman
我有一个简单
的
PHP
脚本
(使用Botman),由我
的
Telegram bot通过
web
钩子调用。它应该在收到关键字时做出响应。这是可行
的
,向我
的
手机发送响应信息。考虑到这可能是由于一些
web
机器人调用我
的
URL,我修改了
脚本
以检查是否存在(和
值
)和查询参数,并且所有随机消息都停止了。网络机器人不会知道这个秘密参数,对吧?正如预期
的
那样,一旦我更新了PHP
脚本
(没有用修改
的<
浏览 3
提问于2022-02-09
得票数 0
回答已采纳
2
回答
Web
抓取
-页面源中未显示内容
python
、
selenium
、
web-scraping
我正在尝试从一个网站上
抓取
信息:。所有数据似乎都是在
重复
卡片中生成
的
,但我在查看页面源代码时找不到这些信息。我尝试过使用像Selenium这样
的
web
驱动程序,但是仍然不能看到我想要
抓取
的
内容。我希望能够提取每个条目的所有
重复
数据。install(), options=chrome_options) dr
浏览 1
提问于2020-08-04
得票数 0
1
回答
抓取
动态表单WWW::机械化Perl
javascript
、
perl
、
www-mechanize
我正在尝试使用WWW::Mechanize模块从页面中
抓取
表单及其字段。因为网页
的
主体是使用document.write JS调用创建
的
,所以此模块中
的
表单方法找不到我正在查找
的
表单,并且对content方法
的
调用将
返回
页面源代码。我需要访问从document.write调用得到
的
超文本标记语言。 有没有可能使用mechanize模块,如果可以,我该怎么做呢?如果没有,是否有其他Perl模块可以帮助我?谢谢!
浏览 3
提问于2014-08-07
得票数 1
2
回答
Google为什么getTemporaryActiveUserKey()为唯一用户
返回
相同
的
值
google-apps-script
我使用创建了一个联系人类型表单,并将其作为
Web
应用程序发布。我
的
问题是,这怎么可能?下面是code.gs中
的
浏览 1
提问于2018-09-09
得票数 4
回答已采纳
1
回答
如何将
值
从ASPX页传递到不同域中
的
另一个页?
asp.net
、
parameter-passing
我
的
应用程序中有一个ASPX页面。来自不同域中其他应用程序
的
ASPX页可以调用此页。但是,如何将
值
返回
给另一个应用程序中
的
调用ASPX页面呢? ASPX页面如何将
值
返回
给不同应用程序中
的
调用页面?
浏览 0
提问于2010-09-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫框架之pyspider
常用Python爬虫框架汇总
如何完善Loadrunner录制后产生的脚本
走近代码之Python-爬虫框架Pyspider
策略-增加收录
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券