腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
html
标签
从
google
搜索
页面
抓取
网页
web-scraping
、
uipath
我正在尝试做一个谷歌
搜索
,并获得前5个结果(标题/URL)到一个excel文档。 我试过
使用
“数据
抓取
”,但根据
搜索
词的不同,谷歌会显示不同的
页面
。有时它会有视频,图像或相关的
搜索
词。因此在大多数情况下,我无法
从
页面
中实际获得所有结果,因为uiPath无法识别它们,这可能是因为不同的div。所以我的想法是通过
html
标签
获取它们,因为每个标题都
使用
H3,但我找不到这样做的方法。
浏览 28
提问于2019-05-08
得票数 0
5
回答
如何告诉谷歌不要为我的网站建立特定关键词的索引?
seo
、
google
、
google-search-console
、
google-search
在
搜索
引擎上
搜索
品牌时,不应该出现其中一个。 你知道怎么做吗?
浏览 0
提问于2019-04-24
得票数 1
2
回答
在Java中
从
某个URL调用脚本?
java
、
javascript
、
html
、
parsing
、
execute
为了方便起见,我
使用
Java解析一个随机网站的超文本标记语言,假设它是。在解析
HTML
数据之后,我希望提取其中的一些数据,并将其显示在显示器上。之后,用户将输入
搜索
词,并按下一个按钮。这个按钮将执行“
搜索
”按钮后面的脚本。我想在几个网站上做到这一点,所以给我一种只与
google
一起工作的方法不会对我有太大帮助。
浏览 0
提问于2012-03-30
得票数 0
回答已采纳
1
回答
如何(动态)改变元
标签
之前,网站是刮角2?
angular
、
web-crawler
、
seo
我已经建立了一个
使用
角度2的
网页
应用程序,并需要使它更友好的
搜索
引擎优化。我想动态地改变头部的值。不同路线的元
标签
,在之前就被Facebook、Instagram和Twitter的网络
抓取
机器人刮掉了。 我可以根据自己的需要动态更新元标记,方法是
使用
@ar角/platform-browser 。我的问题是,社交媒体的网络
抓取
机器人无论在什么情况下都在
搜索
静态的src/index.
html
,而这个角度应用程序还没有添
浏览 3
提问于2020-11-28
得票数 1
回答已采纳
3
回答
停止谷歌机器人不止一次爬行URL?
seo
、
web-crawlers
、
googlebot
、
crawl-rate
根据
搜索
控制台,很多天googlebot每天都会爬行数万次,这表明他们一直在
抓取
他们已经爬过的
页面
。我知道我可以限制googlebot爬行率,但是是否有可能强迫googlebot只爬行一次和一次?
浏览 0
提问于2019-08-08
得票数 2
回答已采纳
2
回答
为什么我们应该
使用
语义
HTML
5元素,比如页眉和页脚而不是div?
seo
、
html
、
technical-seo
、
semantic-elements
我正在设计一个网站,但有些网站
使用
语义
HTML
5标记,如<header>或<footer>,而不是div。 我的问题是,为什么他们这样
使用
他们,有什么害处在SEO当
使用
正常的div?
浏览 0
提问于2021-10-09
得票数 2
回答已采纳
4
回答
允许缓存静态
google
地图吗?
google-maps
然而,当
使用
共享连接时,例如
使用
移动电话和3G接入(电话运营商),这一限制似乎是有问题的。 因此,我的问题如下:我可以在服务器端检索图像并将其提供给我的客户端吗?是允许的吗?
浏览 3
提问于2010-10-08
得票数 22
回答已采纳
1
回答
解析
html
页面
并将内容(标题、文本等)存储到数据库中
java
、
web-crawler
、
web-analytics
有没有人知道一些开源工具来解析
html
页面
,过滤广告,JS等,以获得标题,文本。我的应用程序前端是基于LAMP的。所以我需要解析
html
页面
并将它们存储到Mysql中。并用这些数据填充首页。
浏览 3
提问于2010-09-17
得票数 1
0
回答
抓取
Google
时,
Google
电子表格中的importxml函数出错
xml
、
google-sheets
我正在尝试
使用
函数将一些
Google
搜索
结果
抓取
到我的
Google
电子表格中:而且我一直面临着错误:“无法获取URL”。我试着用不同的
Google
搜索
结果
页面
,不同的
HTML
标签
浏览 8
提问于2017-01-05
得票数 0
3
回答
Python -
抓取
谷歌的简单方法,为给定的
搜索
下载前N个命中结果(整个.
html
文档)?
python
、
web-scraping
、
urllib2
、
google-search
有没有一种简单的方法来
抓取
谷歌,并为给定的
搜索
写出前N个(比如说1000个) .
html
(或其他任何)文档的文本(只是文本)?举个例子,想象一下
搜索
短语“大灰狼”,只下载前1000个点击量中的文本--也就是说,实际上是从这1000个
网页
中下载文本(但只下载那些
页面
,而不是整个网站)。 我假设这将
使用
urllib2库?如果有帮助的话,我会
使用
Python 3.1。
浏览 2
提问于2011-03-16
得票数 10
回答已采纳
1
回答
我能让蓝色棱镜根据关键词来阅读
搜索
引擎的结果吗?
blueprism
我在谷歌
搜索
一些关键术语-当第一页结果打开时,我想让蓝色棱镜选择标题中有“键1”和“键项2”的链接标题,然后打开链接。这意味着,谷歌
搜索
结果中可能会有几个包含(或不包含)两个关键词的结果。
浏览 4
提问于2018-06-07
得票数 0
回答已采纳
1
回答
搜索
引擎还在
搜索
noindex
页面
吗?
seo
、
web-crawlers
、
duplicate-content
、
noindex
、
nofollow
搜索
引擎是否会
抓取
具有“noindex”元属性的
页面
?我之所以问这个问题,是因为我们有一些由分面导航引起的几乎重复的内容,而过滤过的
页面
已经声明了“noindex”,我想知道这些
页面
是否还会被检测为复制的呢?当我们使这些
页面
唯一的时候,我是否必须在链接中添加一个‘no追随者’属性?
浏览 0
提问于2016-11-03
得票数 7
回答已采纳
3
回答
搜索
Google
Play商店
android
、
web-crawler
、
google-play
我想爬行
Google
Play商店下载所有android应用程序的
网页
(所有具有以下基本url的
网页
:)。我检查了play商店的robots.txt文件,它不允许
抓取
这些URL。此外,当我浏览
Google
Play商店时,我只能看到每个类别最多3个
页面
的热门应用程序。如何获取其他应用程序
页面
?如果有人尝试过
抓取
Google
Play,请让我知道以下事情: a)你是否成功地
抓取
了play商店。如果是,请让我知道你是如何
浏览 2
提问于2013-06-09
得票数 10
2
回答
google
爬行错误中的
页面
索引
indexing
、
permalinks
、
web-crawler
、
google-search-console
我想从
google
中删除我
从
服务器上删除的
页面
,或者重定向我
从
服务器上删除的
页面
www.mysite.com/pagename.
html
因此,我
从
google
中删除了站点地图,创建了一个新的站点地图,并上传了 我现在的问题是
google
给我爬行错误,因为删除的
页面
有www
浏览 3
提问于2013-03-14
得票数 0
1
回答
<meta name=“机器人”>不工作
html
、
meta
、
robots.txt
然而,尽管如此,
Google
搜索
控制台仍在抱怨该
页面
是:据我所知,一切都是有效的和正确的,不应该被索引,谁能解释谷歌在抱怨什么? 谢谢
浏览 1
提问于2018-08-13
得票数 2
2
回答
更好的
网页
描述在谷歌
搜索
结果可能
使用
模式?
meta-tags
、
schema.org
、
jsonschema
、
google-schemas
、
json-ld
我成功地
使用
了
Google
模式的JSON实现,使
Google
搜索
结果中的信息更加详细和有意义。更具体地说,我能够让谷歌
搜索
结果显示一个公司的标志和公司的描述,通过添加相关的JSON-LD代码到我的网站的顶部。详情如下: 我现在想要更好的文字描述显示在谷歌
搜索
结果的个人
网页
在我的网站。原因是谷歌没有在某些
网页
上获取元描述
标签
数据,而是在
页面
上
抓取
一些没有描述性、有用性或意义的文本。我想知道我是否可以
浏览 0
提问于2015-08-20
得票数 1
1
回答
谷歌说“
搜索
结果为0”是什么意思?
seo
、
google
、
search-engines
、
google-search
当谷歌说“
搜索
结果为0”时,这意味着什么?谷歌是否试着在显示0的结果之前,
从
它所知道的每一个网站上获得相关的
搜索
结果?
浏览 0
提问于2011-09-06
得票数 0
回答已采纳
1
回答
将深度过滤的类别设置为没有索引是一个很好的实践吗?
ecommerce
、
noindex
、
filtering
、
thin-content
大多数类别将有一个产品结果
页面
和一个过滤器-侧边栏。有时也有独特的文字来帮助客户选择哪一种产品。我的问题是深过滤的结果:这个
页面
可能有两个产品要显示,没有唯一的文本,没有过滤条另外,隐藏针对
google
(prg模式)结果的链接?
浏览 0
提问于2019-03-19
得票数 2
1
回答
如何将
Google
AMP缓存用于我的AMP网站
caching
、
browser-cache
、
amp-html
如何
使用
或设置我的AMP网站谷歌amp缓存。我见过许多网站
从
google
.com服务器管理他们的请求。对我来说怎么可能呢?
浏览 8
提问于2019-12-04
得票数 2
回答已采纳
1
回答
在
网页
中查找“文章”的算法?
algorithm
、
html-content-extraction
一些浏览器插件,如,可以
从
网页
中提取“文章”。有谁知道怎么做吗?真正的文章和广告或评论有什么不同?
浏览 0
提问于2012-09-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用多个Python库开发网页爬虫(一)
搜索引擎喜欢什么后缀的URL
手机网站该怎么做好SEO优化?
利用好这些代码把SEO优化做到极致,最后一个你肯定没用
针对JavaScript的SEO优化指南
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券