腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
URL
中
带有
"#“
的
网站
中
抓取
数据
时
出错
、
、
我尝试使用python从一个
网站
(
url
:中有#号)
中
抓取
数据
,但在将其解析为html文件
时
收到以下错误消息:<body><h2>Bad Request - Invalid
URL
The request <e
浏览 20
提问于2018-07-23
得票数 0
回答已采纳
2
回答
如何在
带有
R
的
网站
的
搜索框中直接书写
、
、
我正在寻找一种方法来做网页
抓取
后,在其搜索框中键入。让我用一个例子更好地解释:我正在寻找一个R函数,它直接在amazon主页上写入单词"notebook“,这样我就可以随后对生成
的
页面进行web
抓取
。感谢大家
的
帮助。
浏览 2
提问于2021-01-25
得票数 1
5
回答
如何
从
其他
网站
获取
数据
?
、
、
、
我想创建一个
网站
,
从
其他
网站
提取信息,并将它们打印到我
的
网站
上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?
浏览 1
提问于2013-06-14
得票数 4
4
回答
视频提供商在Chrome运行
的
不安全内容
中
屏蔽
的
视频
、
、
、
我正在尝试从这个
URL
嵌入一个视频:-这是一个公开
的
视频,它给我
的
嵌入代码如下:- <object id="flashObjP1_Prod_Version=ShockwaveFlash"></embed></obje
浏览 2
提问于2013-08-12
得票数 2
回答已采纳
1
回答
从
给定
网站
抓取
数据
时
出错
、
、
、
我是excel公司
的
vba新手。我成功地编写了一个代码,它从给定
的
网站
中
抓取
数据
,并将其存储在excel工作表
中
。所以要找出原因是很有挑战性
的
。另外,如果您能帮助我加快代码
的
速度(也许不使用剪贴板来粘贴表,但我不知道如何使用否则.)。这个错误是在指定
的
行中进行
的
(有时只是,大多数情况下,子程序工作得很好),并有这样
的
注释:“这是抛
出错
误
的
行。我感
浏览 7
提问于2020-06-14
得票数 0
2
回答
facebook无法
抓取
网站
、
、
我有一个
网站
返回:“解析输入
URL
时
出错
,没有缓存
数据
,或者没有
抓取
数据
。”注意:经过一段时间后
浏览 0
提问于2014-11-17
得票数 0
1
回答
对于一个
url
,它应该只索引一次。
、
任何一个点我正确
的
文档或黑客停止nutch重新索引或获取相同
的
内容。对于给定
的
url
,我只想
抓取
一次。
浏览 2
提问于2014-08-20
得票数 0
4
回答
C# AJAX或Java response HTML
抓取
在C#中有没有一种方法可以获得AJAX或Java
的
输出?我试图做
的
是获取网页上项目的细节,但是网页不会将其加载到原始源
中
。有没有人有好
的
教程或者好
的
起点? 例如,我想从获取所有的汽车列表
浏览 1
提问于2011-06-06
得票数 1
回答已采纳
1
回答
网站
URL
不是有效
的
URL
我正在尝试创建facebook应用程序与
网站
网址,但它说
网站
URL
不是有效
的
URL
。我不确定问题出在哪里。
浏览 0
提问于2012-02-02
得票数 4
回答已采纳
1
回答
抓取
PHP cURL和XPath,如何提高速度?
、
、
、
目前我正在使用PHP cURL和XPath进行
抓取
,但速度非常慢。我用上面的代码总共刮掉了大约150个网页。每个脚本获取一个
浏览 1
提问于2011-07-25
得票数 1
1
回答
Azure ML错误
中
的
R
抓取
、
、
我用RStudio编写了一个脚本(运行R3.5.2),它可以
从
特定
的
网站
抓取
数据
。脚本延伸到一个
网站
,使用download.file来提取底层代码,并使用标记提取所需
的
数据
。脚本在RStudio
中
运行时没有
出错
,但是当我试图在Azure
中
的
"Execute“节点中运行代码
时
,它会抛出一个0063错误,说明它”无法到达
URL
“。代码完美地
浏览 0
提问于2019-05-01
得票数 1
回答已采纳
2
回答
无标题- Wordpress facebook共享
、
、
我使用wordpress 3.4.1创建了我
的
网站
,并尝试在facebook中分享我
的
网页。我在facebook
的
帖子
中
没有得到任何缩略图或基本
的
博客描述。相反,我得到
的
是“没有标题”。但是,他们
中
的
大多数都在走向死胡同。有人能在这方面帮助我吗?分析
URL
时
出错
:分析输入
URL
时
<e
浏览 1
提问于2012-08-16
得票数 1
回答已采纳
1
回答
wget:识别中断
的
出站链接
wget
的
S --spider选项可以简单地识别出断开
的
内部链接:我尝试用-H扩展它以查找断开
的
出站链接,但是(据我所知)您不能在外部域上指定一个额外
的
递归级别,所以在--level=0
中
保留让爬行器可以覆盖整个万维网。我能想到
的
一个解决办法是使用
网站
的
sitemap.xml (如果有可用的话)来获取整个域
的
URL
集
浏览 0
提问于2022-08-16
得票数 2
4
回答
用Python实现表Web
抓取
问题
、
、
、
我有问题从这个
网站
抓取
数据
:我对python相对陌生,对web
抓取
完全陌生。以下是我到目前为止所拥有的:from bs4 import BeautifulSoup h
浏览 1
提问于2020-06-22
得票数 1
回答已采纳
2
回答
在网页中加载更多内容,并发出写入文件
的
问题
、
、
、
、
我正在进行一个网络
抓取
项目,它涉及到从一个基于搜索词
的
网站
中
抓取
URL
,将它们存储在一个CSV文件
中
(在一个列下),最后从这些链接
中
抓取
信息并将它们存储在一个文本文件
中
。 代码
的
后半部分只读取最后一个链接(存储在csv文件
中
浏览 8
提问于2017-07-19
得票数 0
回答已采纳
1
回答
从
Facebook拉取给定
URL
的
共享缩略图
、
、
、
我想从以下位置拉出共享站点
的
缩略图: <div class="UIThumbPager_Thumbs">谢谢!:)
浏览 0
提问于2010-09-02
得票数 1
回答已采纳
1
回答
如何检测
URL
列表
中
的
重复值并停止迭代?
、
、
、
我正在尝试使用puppeteer & cron
抓取
一个
网站
。它工作得很好,除了我不知道如何停止程序执行,如果检测到重复
的
url
?下面是我
的
项目的伪代码: // target = grab the <a> tag from site // saveit to the file 虽然这段代码运行良好,但当我在scheduler&
浏览 19
提问于2020-12-11
得票数 0
回答已采纳
2
回答
正在尝试
从
R
中
的
url
加载
数据
、
所以我想从这个
url
加载所有格式化
的
数据
: 转换成r,这样我就可以过滤掉其中
的
一些。一旦我得到它,我知道如何正确地过滤它,但我不能将它“注入”到R
中
。如果
url
以".txt“或".csv”结尾,我已经看到了许多拉取
数据
的
方法,但是如果这个
url
不是以文件类型结尾,那么我知道如何获取它
的
唯一方法就是拉出html,但是我得到...所有的html。有几种选择可以将文件下载为.csv并以这种方式注入它,但
浏览 3
提问于2016-04-07
得票数 0
1
回答
Python
从
多个
网站
URL
中
抓取
数据
、
、
、
对于我
的
一个网络项目,我需要从不同
的
网站
来源刮
数据
。为了简单起见,我用一个例子来解释。。。我怎样才能写一个规范化
的
脚本来遍历那些列出
的
网页
URL
的
HTML和刮取
数据
,不管它们<em
浏览 7
提问于2014-11-18
得票数 3
回答已采纳
1
回答
如何
从
只使用一个
url
的
网站
抓取
数据
、
、
、
我是一名学生,我正在尝试
从
我们
的
在线注册
中
抓取
数据
,以便不一致机器人可以发送关于不一致
的
信息,该
网站
需要登录,我可以使用以下代码: import requestslogin_
url
="
url
" result = session_requests.get(login_
url
),
浏览 28
提问于2020-09-08
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券