腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何在ABOT
C
#网络
爬虫
中获取html输出页面?
、
我正在尝试用ABOT在
c
#.i中制作网络
爬虫
,我搜索了很多例子,并添加了ABOT网络
爬虫
。从那我只能得到日志输出而不是超文本标记
语言
页面输出。我想得到超文本标记
语言
页面输出only.because,超文本标记
语言
输出是超文本标记
语言
敏捷工具的输入。帮助我从ABOT网络
爬虫
在
C
#中获得超文本标记
语言
输出。谢谢。
浏览 4
提问于2013-09-12
得票数 5
2
回答
PHP与
、
、
我计划制作的网络
爬虫
,可以抓取200+领域,哪一种
语言
将适合它。我非常熟悉PHP,但我是Python的业余爱好者。
浏览 2
提问于2014-11-21
得票数 0
回答已采纳
3
回答
非常简单的
C
++网络
爬虫
/蜘蛛?
、
我试图在
C
++中做一个非常简单的网页
爬虫
/蜘蛛应用程序。我一直在使用谷歌搜索一个简单的,以了解这个概念。我发现了这个: 然而,这是复杂的理解对我来说,因为我开始学习
C
++大约一个月前。
浏览 15
提问于2010-11-25
得票数 22
回答已采纳
3
回答
C
++网络
爬虫
、
、
、
我正在尝试并尝试制作一个最小的网络
爬虫
。我在很高的层次上理解了整个过程。那么进入下一层细节,程序如何“连接”到不同的网站来提取HTML?谢谢!
浏览 1
提问于2012-07-01
得票数 0
回答已采纳
5
回答
哪种
语言
最适合高效的网络
爬虫
?
、
我需要写一个网络
爬虫
,我需要哪种
语言
是性能最好的
语言
,比如内存和性能。 编辑:原名是“为速度和性能而优化的
语言
c
++或
C
#”
浏览 7
提问于2010-09-21
得票数 0
1
回答
next/head中的NextJs meta标签不适用于Facebook和metatags.io
、
我创建了一个组件SeoHeader来处理NextJs项目上的元标记创建import Head from 'next/head'; const router = useRouter(); <Head> <met
浏览 8
提问于2021-10-18
得票数 1
1
回答
有没有一种方法可以用NCrawler提取特定的html标签信息
、
、
规格: Win7 64、VS 2010、.NET 4.0、NCrawler库 我正在写一个
爬虫
,它将从网上商店提取一些数据。应用程序可以很好地提取URL,我可以正确地导航到商店中的每一件商品。
浏览 0
提问于2014-11-30
得票数 0
5
回答
Googlebot是用哪种编程
语言
编写的(或任何其他高效的网络
爬虫
)?
、
有人知道谷歌机器人是用哪种编程
语言
编写的吗? 或者,更普遍的是,高效的网络
爬虫
是用哪种
语言
编写的?我见过很多Java
语言
,但在我看来,它不是最适合开发网络
爬虫
的
语言
,因为它产生了太多的开销(尝试使用Heritrix网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
5
回答
如何将动态站点转换为可从CD演示的静态站点?
、
、
有没有人对
爬虫
有什么好的建议,可以处理像链接清理,flash,一些ajax,css等等?我知道机会很小,但我认为在我开始编写自己的工具之前,我应该在这里抛出这个问题。
浏览 3
提问于2008-09-22
得票数 9
回答已采纳
1
回答
如何检测网页中大多数不常见的超链接和隐式重定向?
、
、
、
、
我在
C
++/Qt4.8.5中为Windows创建了网站
爬虫
。我发现,有时页面可能包含隐式(伪)重定向,就像script标记中的script。原始
爬虫
只检测到href标记中的a属性。但是还有其他节点可以包含urls。例如,<META HTTP-EQUIV="REFRESH" CONTENT="0; URL=/relative_url">。也许,
C
++/Java中的某些库包含了这些情况的处理。 另外,我注意到向请求中添加首选
语言
浏览 1
提问于2014-03-30
得票数 3
回答已采纳
1
回答
网站数据
爬虫
,发布数据和遍历
、
、
我想编写这样一个
爬虫
。那么,哪种工具/
语言
最适合
实现
这一点呢?我已经精通java和
C
语言
,所以任何基于它们的东西都会很有帮助。
浏览 1
提问于2013-03-27
得票数 0
1
回答
TYPO3 - indexed_search -
爬虫
配置-多
语言
站点
、
、
我想禁用前端索引,利用
爬虫
。如何设置以下
爬虫
配置:( B)用几种
语言
编制定制记录索引 但是,在文档中没有任何关于
语言
的内容:
浏览 0
提问于2018-07-24
得票数 1
回答已采纳
2
回答
国家/地区/城市数据库
、
多
语言
意味着城市和国家的名称应该出现在当地
语言
上。 或者可能存在任何具有此功能的服务?
浏览 1
提问于2011-11-01
得票数 1
回答已采纳
1
回答
404页会损害网站页面排名吗?
、
、
、
、
我有一个在线市场平台。由于添加了新产品/服务,我不得不更新链接以匹配新列表。早些时候,谷歌已经为我的大部分页面建立了索引。现在,随着新的链接架构,谷歌显示的大多数结果是404。我提交了新的网站地图和新的链接还有待索引。请让我知道你的输入,因为我的大部分流量来自谷歌搜索,修复这是非常重要的对我们。 谢谢你,安吉
浏览 0
提问于2014-02-13
得票数 1
1
回答
当使用Firebase托管i18n重写时,如何告诉搜索引擎网站的本地化版本?
、
、
、
它允许您根据用户的国家或首选
语言
提供不同的内容。但是,如何通过i18n重写
实现
这种可发现性呢?
浏览 1
提问于2020-08-28
得票数 3
回答已采纳
2
回答
有效地搜索大量URL列表
、
、
、
我正在建立一个网络
爬虫
,它必须爬行数百个网站。我的
爬虫
保存了一个已经爬行的urls列表。每当
爬虫
要爬行一个新页面时,它首先搜索已经爬行的url列表,如果已经列出了,则
爬虫
跳到下一个url,以此类推。
爬虫
目前是用Python编写的。但我将把它移植到
C
++或其他更好的
语言
中。
浏览 5
提问于2016-06-23
得票数 0
回答已采纳
1
回答
我的规范URL应该包含
语言
参数吗?
、
、
、
、
我们的网站提供不同的
语言
,可以通过一个URL参数,即时切换。总是使用https://example.org/,假设
语言
并不重要,因为内容在意义上是相同的。我想这是错误的,因为
爬虫
将是英语,所以它
浏览 0
提问于2016-11-23
得票数 3
3
回答
谷歌机器人信息?
、
、
有没有人知道更多关于谷歌网络
爬虫
(又称GoogleBot)的细节?我很好奇它是用什么写的(我自己做了几个
爬虫
,现在正准备做另一个),以及它是否能解析图像之类的东西。我假设它是这样做的,b/
c
images.google.com中的图像都被调整了大小。也许它们都是用
C
/
C
++编写的。提前谢谢你-
浏览 1
提问于2010-04-14
得票数 0
回答已采纳
1
回答
如何在网站上为不同的蜘蛛设置不同的
语言
?
、
、
我有多
语言
网站。实际上,网站
语言
是根据web浏览器
语言
来选择的。 用俄语显示网站上的燕德龙蜘蛛?
浏览 2
提问于2012-01-16
得票数 1
1
回答
如何为我的网站编制索引
、
我刚刚遇到了Elastic Search,我已经完成了安装和示例索引以及搜索。现在我想把这个用在我的网站上。为此,如何为我的网站创建索引?我是否需要将整个网页内容存储为索引??
浏览 0
提问于2011-06-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Go语言网络爬虫调度器的实现
c语言实现选择排序算法
【C语言教程】双向链表学习总结和C语言代码实现!值得学习
C语言实现蛇形数的输出
C语言实现简易聊天室
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券