腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
DuckDuckGo
结果
抓取
、
、
、
代码: from bs4 import BeautifulSoupimport requests https://www.merriam-webster.com/dictionary/test https://en.wikipedia.org
浏览 31
提问于2020-12-28
得票数 1
回答已采纳
2
回答
无法从
DuckDuckGo
搜索
结果
中
抓取
链接
、
、
、
我想从
DuckDuckGo
搜索
结果
中
抓取
第一个链接。它打印网页的HTML,而不是那些包含div的
结果
。我不知道为什么BeautifulSoup不
抓取
包含div的
结果
。请看屏幕截图,突出显示的HTML语法是我想要
抓取
的: 我找到了一个答案,
DuckDuckGo
使用javascript搜索
结果
,beautifulSoup不能
抓取
javascript,但在StackOverflow上的其他帖子中,我发现人们可以从搜索
浏览 6
提问于2021-04-02
得票数 0
1
回答
使用JSoup获取所有页面的
结果
、
我必须
抓取
DuckDuckGo
,并为每个页面获取查询
结果
的所有标题,但要使用我只得到了关于第一页的
结果
。我怎样才能继续读到下一页?
浏览 3
提问于2017-08-29
得票数 1
回答已采纳
1
回答
Pycurl javascript
、
、
、
我创建了一个Python3脚本,它允许我在搜索引擎(
DuckDuckGo
)上进行搜索,获得HTML源代码并将其写入文本文件。import pycurlc = pycurl.Curl() c.setopt(c.URL, 'https://
duckduckgo
.com我希望有相同的超文本标记语言源代码,我将通过在我的终端上运行curl https://
duckduckgo
.com/?q=test获得
浏览 0
提问于2018-09-28
得票数 1
1
回答
importXML()可以用来从SERP中
抓取
数据吗?
、
我读过一篇文章,解释了如何在Google Sheets中使用importXML()函数访问网页,从网页中
抓取
数据,并将
结果
放入单元格中。参数更改为"num=20“,得到的响应是”无法获取URL...“ 然后,我在另一个单元格中输入相同的公式,将URL替换为"https://www.google.com“,并将gl参数替换为"gl=US”,
结果
仍然是顺便说一句,我在一个论坛上读到,你可以使用谷歌的自定义搜索API和UrlFetch()来收集搜索
结果
并填充谷歌工作表。但在尝试之
浏览 18
提问于2019-03-05
得票数 1
1
回答
如何获得独特的搜索
结果
?
、
、
、
我使用这个()模块来
抓取
duckduckgo
搜索
结果
:>>> for links in
duckduckgo
.search('Yellow Chris Martinprint links重复4次相同的链接http://www.youtube.com/watch?v=1MwjX4dG72s 如何解决这一问题,并获得相同的<
浏览 5
提问于2016-06-20
得票数 1
回答已采纳
1
回答
如何使用Python编辑
DuckDuckGo
中显示的句子数量?
、
、
、
、
我正在编写一个脚本,它将使用
DuckDuckGo
抓取
我的问题的所有答案!我试着使用
DuckDuckGo
的API来做这件事,它也能工作,但
结果
给出了大量的信息。有没有办法限制它的句子?r = requests.get("https://api.
duckduckgo
.com", "q": query, "format": "
浏览 6
提问于2021-11-23
得票数 0
2
回答
用Python3.6
抓取
Duckduckgo
、
我可以从
duckduckgo
搜索的第一页中
抓取
结果
。然而,我正在努力进入第二页和后续页。我在Selenium中使用了Python,这对于第一个页面的
结果
来说是很好的。我用来刮第一页的代码是:- results_url = "https://
duckduckgo
.com/?
浏览 4
提问于2017-10-16
得票数 3
回答已采纳
1
回答
使用Python请求请求
DuckDuckGo
时的奇怪错误
、
、
、
我试图使用Python库来获取
DuckDuckGo
搜索
结果
:url = "https://
duckduckgo
.com/html/?但是,每当我的查询包含双引号“和通配符这样的特殊字符*时,
DuckDuckGo
告诉我没有搜索
结果
,尽管当我使用浏览器访问相应的页面时,我可以看到
结果
。例如: https://
duckduckgo
.com/?q=example&a
浏览 4
提问于2021-09-09
得票数 0
5
回答
C#中任何好的开源网络爬行框架
、
、
、
编辑:我必须
抓取
的一些网站使用非常复杂的Java Script呈现页面,现在这增加了我的网络爬虫的复杂性,因为我需要能够
抓取
由JavaScript呈现的页面。如果有人在C#中使用过任何可以
抓取
javascript渲染的库,请一定要分享。我用过我不喜欢的watin,我也知道有关硒的知识。如果你知道除了这些以外的任何事情,请与我和社区分享。
浏览 2
提问于2010-12-06
得票数 9
回答已采纳
2
回答
Python /每次打印并分配随机数
、
、
()) while x < 3: grow = grow + 1在这里一切正常,函数“打印”打印不同的
结果
例如:>>>https://
duckduckgo
.com/html?q=44543 >>>https://
duck
浏览 16
提问于2017-03-10
得票数 0
1
回答
DuckDuckGo
搜索返回“超出范围的列表索引”
、
import
duckduckgo
print r.results[0].url[<
duckduckgo
.Result object at 0x0000000002E98F60>] 但如果我找的不是“
DuckDuckGo
”。
浏览 6
提问于2013-08-10
得票数 5
1
回答
用Python进行AJAX调用
、
、
、
、
我正在尝试使用自制的Python从网页中获取锚元素的href属性的值。但是,锚元素所在的div元素的所有内容都是由网页在最初加载时使用AJAX jQuery调用来接收的。div元素包含大约90%的网页内容。如何获得div元素的内容以及锚元素的href属性的值?在我得到这个之后,我将使用BeautifulSoup来解析网页。那
浏览 0
提问于2015-05-11
得票数 2
回答已采纳
1
回答
为什么谷歌(和必应)不把我的刮板列入黑名单?
、
、
我需要像这样指定一个搜索查询来
抓取
搜索引擎的
结果
:"firstName lastName linkedin“。目的是提取linkedin个人资料URL。通常,这是第一个搜索
结果
。我使用一个简单的nodeJs库和一个递归实现(如下所示)
抓取
了近1500个名字。另外,为了测试搜索引擎的局限性,我运行了4个并行实例,每个实例分别指向google、bing、yahoo和
duckduckgo
: const sec = require('search-engine-client
浏览 0
提问于2018-01-10
得票数 0
1
回答
删除或重新索引内容的
DuckDuckGo
?
、
我修改了一些内容,我同样希望
DuckDuckGo
重新索引或删除内容。 旧的内容在索引中,已经过时一段时间了。是否有一种方法可以提示
DuckDuckGo
重新索引/删除类似于Google的工作方式?
浏览 0
提问于2020-06-12
得票数 2
回答已采纳
1
回答
如何在不替换链接的情况下使用file_get_contents(url)刮取
、
因此,我正在尝试使用file_get_contents($url)进行
抓取
,但是返回的内容已经修改了它的所有链接(域名被删除了,并且添加了许多奇怪的字符,以防止锚hrefs和图像srcs)。 $url = 'https://
duckduckgo
.com/html/?附带问题:是否有更好的方法来刮除
duckduckgo
的
结果
?我看到他们没有公共搜索api (可用的只是一个不适用于搜索的答案api )
浏览 2
提问于2020-05-01
得票数 0
回答已采纳
3
回答
DuckDuckGo
在使用Python请求时返回418
、
我正在编写一个脚本,用于打开firefox,其中包含为给定术语找到的第一个
duckduckgo
结果
。url = "https://
duckduckgo
.com/?t=ffab&q=python+request+
duckduckgo
&ia=software"
Duckduckgo
返回418。 这是怎么回事?
duckdu
浏览 0
提问于2020-07-23
得票数 3
回答已采纳
3
回答
如何用Python从
DuckDuckGo
的图像搜索
结果
中
抓取
图像
、
、
我正在用python创建一个应用程序,它将显示从
DuckDuckGo
的图像搜索
结果
中刮来的图像。因此,我需要一个列表的链接到图像的基础上的搜索。问题是,构成
DuckDuckGo
图像搜索
结果
的HTML不包含任何图像标记,而是将图像存储在除法标记中。在python的帮助下,我如何才能
抓取
到图像的链接,并将它们存储在程序中的一个变量中呢?%2Fthumb%2F8%2F88%2FDuckDuckGo_logo.svg%2F1200px-
DuckDuckGo
_logo.svg.png",
浏览 5
提问于2019-05-14
得票数 3
回答已采纳
1
回答
Duckduckgo
API不显示
结果
、
我正在使用PHP的
duckduckgo
API。API可以工作,但是如果我搜索一个短语,浏览器中什么也不会出现。如果我搜索“Freelance”,就会出现搜索
结果
。我可以做些什么来允许显示短语
结果
吗?以下是我的代码 <?
浏览 1
提问于2012-11-15
得票数 2
1
回答
是否有办法(即URL参数)强制
duckduckgo
只显示所有搜索项的
结果
这个问题寻找一种如何以只产生
结果
的方式使用https://
duckduckgo
.com/lite的方法,即页面实际上包含所有搜索到的单词。搜索操作符:关于猫或狗的cats dogs
结果
cats -dogs
结果
减少了狗的数量 cats +dogs更多狗在
结果
猫https://
duckduckgo
.com
浏览 0
提问于2019-02-04
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券