腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
Googlebot是用哪种编程
语言
编写的(或任何其他高效的网络
爬虫
)?
、
有人知道谷歌机器人是用哪种编程
语言
编写的吗? 或者,更普遍的是,高效的网络
爬虫
是用哪种
语言
编写的?我见过很多Java
语言
,但在我看来,它不是最适合开发网络
爬虫
的
语言
,因为它产生了太多的开销(尝试使用Heritrix网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
3
回答
如何在ABOT C#网络
爬虫
中获取html输出页面?
、
我正在尝试用ABOT在c#.i中制作网络
爬虫
,我搜索了很多例子,并添加了ABOT网络
爬虫
。从那我只能得到日志输出而不是超文本标记
语言
页面输出。我想得到超文本标记
语言
页面输出only.because,超文本标记
语言
输出是超文本标记
语言
敏捷工具的输入。帮助我从ABOT网络
爬虫
在C#中获得超文本标记
语言
输出。谢谢。
浏览 4
提问于2013-09-12
得票数 5
1
回答
TYPO3 - indexed_search -
爬虫
配置-多
语言
站点
、
、
我想禁用前端索引,利用
爬虫
。如何设置以下
爬虫
配置:( B)用几种
语言
编制定制记录索引 但是,在文档中没有任何关于
语言
的内容:
浏览 0
提问于2018-07-24
得票数 1
回答已采纳
2
回答
PHP与
、
、
我计划制作的网络
爬虫
,可以抓取200+领域,哪一种
语言
将适合它。我非常熟悉PHP,但我是Python的业余爱好者。
浏览 2
提问于2014-11-21
得票数 0
回答已采纳
1
回答
如何在网站上为不同的蜘蛛设置不同的
语言
?
、
、
我有多
语言
网站。实际上,网站
语言
是根据web浏览器
语言
来选择的。 用俄语显示网站上的燕德龙蜘蛛?
浏览 2
提问于2012-01-16
得票数 1
1
回答
如何为我的网站编制索引
、
我刚刚遇到了Elastic Search,我已经完成了安装和示例索引以及搜索。现在我想把这个用在我的网站上。为此,如何为我的网站创建索引?我是否需要将整个网页内容存储为索引??
浏览 0
提问于2011-06-07
得票数 1
回答已采纳
2
回答
Lucene
爬虫
(它需要建立lucene索引)
、
、
我正在寻找Apache Lucene网络
爬虫
写在java,如果可能的话,或在任何其他
语言
。
爬虫
必须使用lucene并创建有效的lucene索引和文档文件,因此这就是nutch被排除的原因。有没有人知道这样的网络
爬虫
是否存在,如果答案是肯定的,我可以找到它。Tnx..。
浏览 0
提问于2009-10-16
得票数 1
回答已采纳
2
回答
将外部网页显示为我的应用程序中的网页
、
、
、
、
我想在我的应用程序中以一种对SEO
爬虫
更快更好的方式在我的应用程序中显示一个外部网页(就像它在该站点中呈现的那样),我想知道是否有一种使用
javaee
的方法?
浏览 5
提问于2012-07-29
得票数 1
回答已采纳
1
回答
next/head中的NextJs meta标签不适用于Facebook和metatags.io
、
我创建了一个组件SeoHeader来处理NextJs项目上的元标记创建import Head from 'next/head'; const router = useRouter(); <Head> <met
浏览 8
提问于2021-10-18
得票数 1
1
回答
如何检测网页中大多数不常见的超链接和隐式重定向?
、
、
、
、
我在C++/Qt4.8.5中为Windows创建了网站
爬虫
。我发现,有时页面可能包含隐式(伪)重定向,就像script标记中的script。原始
爬虫
只检测到href标记中的a属性。但是还有其他节点可以包含urls。例如,<META HTTP-EQUIV="REFRESH" CONTENT="0; URL=/relative_url">。另外,我注意到向请求中添加首选
语言
的标题不能更改站点的页面
语言
。我的意思是Chrome在某些
语言
中有
浏览 1
提问于2014-03-30
得票数 3
回答已采纳
2
回答
在web.xml中激活表达式
语言
、
、
、
Eclipse、JEE、Tomcat、servlet、JSP和表达式
语言
--我正在做一些简单的示例,应该演示MVC模式--servlet控制器将请求转发到适当的JSP页面,其中我需要使用表达式
语言
(在JSP要在JSP页面中使用表达式
语言
,我需要在web.xml文件中激活它,所以我将这些行放在web.xml中:<web-app xmlns="http://java.s
浏览 4
提问于2013-10-30
得票数 0
回答已采纳
1
回答
有没有一种方法可以用NCrawler提取特定的html标签信息
、
、
规格: Win7 64、VS 2010、.NET 4.0、NCrawler库 我正在写一个
爬虫
,它将从网上商店提取一些数据。应用程序可以很好地提取URL,我可以正确地导航到商店中的每一件商品。
浏览 0
提问于2014-11-30
得票数 0
1
回答
是否有一个无处不在的网络
爬虫
可以生成一个良好的特定于
语言
的数据集来训练一个转换器?
、
、
似乎有很多值得注意的人工智能工具正在接受由网络
爬虫
生成的数据集的培训,而不是人工编辑的、人工编译的语料库(Facebook Translate,GPT-3)。有没有任何无处不在的网络
爬虫
,它做的基本相同的事情,但有一个参数的“
语言
寻求”?换句话说,用X
语言
生成一个网络爬行数据集?(背景:我想在任何
语言
中创建一个
语言
数据集,然后对其进行训练,这是一种可以将
语言
中的单词进行符号化的函数。)
浏览 0
提问于2021-11-18
得票数 0
5
回答
哪种
语言
最适合高效的网络
爬虫
?
、
我需要写一个网络
爬虫
,我需要哪种
语言
是性能最好的
语言
,比如内存和性能。 编辑:原名是“为速度和性能而优化的
语言
c++或C#”
浏览 7
提问于2010-09-21
得票数 0
2
回答
带有最佳可定制
爬虫
和抓取器的建议
、
、
、
我相信
爬虫
是最好的方法吗?如果我的理解是正确的,请建议您是否有任何其他方法来获取信息,而不使用来自各种来源的
爬虫
。因为这非常耗费资源和时间。在选择
爬虫
之前,我应该考虑哪些因素。任何提供信息和研究因素的来源在创建
爬虫
或教育
爬虫
时都需要考虑,这将是很棒的。我更喜欢用java编写代码,但我可以用任何其他
语言
编写代码,
浏览 0
提问于2010-11-11
得票数 0
7
回答
哪些
语言
适合编写网络
爬虫
?
、
、
、
我有丰富的PHP经验,尽管我意识到PHP可能不是大型网络
爬虫
的最佳
语言
,因为进程不能无限运行。人们推荐的
语言
是什么?
浏览 1
提问于2010-09-08
得票数 3
回答已采纳
1
回答
搜索引擎
爬虫
会被重定向到多语种网站的英文页面(从而避免使用其他
语言
的页面)
、
、
、
、
example.com/de/article123 # german 根据浏览器
语言
($_SERVER['HTTP_ACCEPT_LANGUAGE']),有一个自动302重定向到相关
语言
这对用户体验很有好处,因为大多数用户不必手动单击
语言
开关。据我的统计,效果很好。Problem:当使用Ahrefs网站审核工具(对于搜索引擎
爬虫
,GoogleBot,.)时,我发现的
爬虫
会重定向到302,因此永远不会访问法语网站。我想这些
爬虫
不考虑c
浏览 4
提问于2021-12-01
得票数 0
2
回答
建立一个友好的多
语言
网站
、
、
我想弄清楚如何用
语言
选择器来建立一个网站。我只是不确定这是建立一个多
语言
网站的正确方式,因为
爬虫
不会再次以不同的
语言
扫描页面,对吗?(或者它可以检测到
语言
已经被修改了,并且重
浏览 2
提问于2011-10-01
得票数 4
回答已采纳
2
回答
国家/地区/城市数据库
、
多
语言
意味着城市和国家的名称应该出现在当地
语言
上。 或者可能存在任何具有此功能的服务?
浏览 1
提问于2011-11-01
得票数 1
回答已采纳
2
回答
爬虫
读取的JQuery文档就绪操作?
、
如果我有由jQuerys document.ready生成并放入正文中的超文本标记
语言
,谷歌和其他
爬虫
会在正文中看到这个超文本标记
语言
吗,或者它不会被计算在内?
浏览 2
提问于2011-06-23
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux搭建JavaEE环境
Go语言网络爬虫概述
R语言网络爬虫经验
基于r语言的爬虫
JavaEE——Ajax
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券