腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
用php编写客户端重定向服务器端
javascript
、
php
、
.htaccess
、
redirect
我不想做301 - 302 - 307等重定向的原因是因为我希望页面向
爬虫
程序发送一个200HTTP OK响应。我通常使用
混淆
的JavaScript在静态use主机(如S3 )上执行此操作,但是,我意识到
爬虫
程序可能会拾取
JS
,因为它是客户端。我使用的未被阻塞的
JS
代码示例;然而,
爬虫
很难找到PHP,所以我想做一个类似的重定向,但用的是PHP。
浏览 0
提问于2015-07-29
得票数 0
1
回答
如何抓取Vue构建的基于组件的web应用程序并作出反应?
reactjs
、
vue.js
、
web-crawler
、
abot
doctype html> <body> </div> <script type=text/javascript src=/static
浏览 7
提问于2022-03-06
得票数 0
回答已采纳
14
回答
如何向用户证明我的模糊代码没有恶意而没有
混淆
?
javascript
、
trust
、
obfuscation
我创建了我自己的
反
adblock系统,它做一些类似于BlockAdblock之类的服务,除了我的系统以不同的方式进行阻滞剂检测(到目前为止还不能像BlockAdblock那样被绕过)。如果您转到我的
反
阻断剂网页并生成一些
反
adblock代码示例,您会注意到这些代码都是模糊的(BlockAdblock也是这样做的),这是为了使过滤器和绕过方法更难开发。代码不能不被
混淆
或篡改/编辑(这样做会导致它不能工作)。 这个
混淆
的
反
adblock代码的每一代都是唯一的,但它们都执行相同的操作
浏览 0
提问于2021-08-15
得票数 31
回答已采纳
4
回答
保护.Net应用程序不受去模糊处理程序的影响?
.net
、
obfuscation
、
deobfuscation
我知道我们可以通过使用
混淆
程序来保护.Net应用程序不被反编译。是那么回事吗?如果是,如何保护应用程序免受deobfuscators攻击?
浏览 1
提问于2011-12-16
得票数 0
回答已采纳
1
回答
我应该保护我的公共GnuPG-Key的链接不受电子邮件
爬虫
的攻击吗?
email
、
obfuscation
、
gnupg
如果我想在我的主页上上传我的公共GnuPG-Key,我应该
混淆
这个GnuPG-Key的链接吗?(例如,使用JavaScript的一些代码)PS:在这个帖子中,我不想讨论是否有必要花时间来
混淆
电子邮件地址的问题。请想象一下,对于这篇文章,防止
爬虫
的电子邮件地址是很重要的。
浏览 2
提问于2012-02-21
得票数 2
回答已采纳
3
回答
混淆
被认为是密码原语吗?
algorithm-design
、
terminology
、
software-obfuscation
混淆
的一般定义是模糊消息的过程(不一定是源代码)。有一种“严格”的
混淆
方法(不可区分的
混淆
、可提取的
混淆
)和不那么严格的方法(意大利面代码、
反
模式、很少使用的语言行为,.)。但是
混淆
是一种密码原语吗?
浏览 0
提问于2019-10-01
得票数 2
回答已采纳
1
回答
Laravel登录页面的Acunetix扫描
php
、
security
、
laravel-5.1
、
csrf-protection
扫描结果显示“由:
爬虫
发现”。 "_token“不是CSRF令牌元素的可识别名称吗?“被
爬虫
发现”是什么意思?这是否意味着扫描只检查表单HTML,而不检查其他任何内容?
浏览 3
提问于2016-05-06
得票数 0
回答已采纳
1
回答
使用AWS Glue Crawler创建列名时删除/重命名特殊字符
amazon-web-services
、
amazon-ec2
、
aws-glue
、
aws-glue-data-catalog
我正在使用AWS
爬虫
爬行S3桶,它在雅典娜中创建表模式。据我所知,雅典娜不支持具有特殊字符的列名,比如(
反
斜杠)等等。这是一种可以在
爬虫
从S3桶中爬行时排除/重命名这些列名的方法。
浏览 3
提问于2021-10-14
得票数 2
回答已采纳
1
回答
抓取的html与浏览器中的html不同
web-crawler
我使用网络收获来获取HTMLs,但是我发现我得到的和浏览器中的略有不同。html中的几个数字被一个破折号(-)替换成了用web采集爬行的HTML中的数字。我保证我的浏览器中的URL和web采集中的http请求中的URL是相同的。我怎么才能让它工作呢?
浏览 0
提问于2014-09-23
得票数 1
1
回答
在数据库中查找和替换URL,而不尾随URL末尾的斜杠
database
、
wordpress
、
url
、
redirect
、
replace
但是,一些放置内容的人在<a href""></a> URL的末尾没有添加
反
斜杠(尾斜杠)的情况下就生成了URL。它会自动添加一个
反
斜杠到末尾,这可以算作谷歌
爬虫
的重定向。TL;博士 如何在没有
反
斜杠的情况下替换WordPress内容中的所有URL,使用(https://test.com/testpage)并添加
反
斜杠(https://test.com/testpage/
浏览 0
提问于2020-10-15
得票数 0
1
回答
对Web Crauler隐藏的网页联系信息
php
、
web-crawler
换句话说,在执行php代码后,网络
爬虫
是按照服务器上的页面(使用php代码)还是在浏览器上显示的所有信息来“看到”页面?
浏览 9
提问于2021-09-29
得票数 0
回答已采纳
1
回答
如何在Python中轻松地允许带有
反
斜杠的位置输入
python
、
python-2.7
不幸的是,我公司的标准包括在文件夹位置使用
反
斜杠而不是正斜杠。 如果我或其他人在带有
反
斜杠的位置上复制,代码就会
混淆
,因为它认为它是转义字符。有什么简单的方法可以复制和粘贴带有
反
斜杠的位置(通过输入()),然后轻松地将转义字符更改为正斜杠?
浏览 8
提问于2016-07-20
得票数 0
回答已采纳
1
回答
结构化数据`@type` `和`@id`‘仅在主“产品”页面中,还是在引用“产品”的所有页面中?
seo
、
schema.org
、
structured-data
我的想法是,这样的话,
爬虫
就会确切地知道我们在页面上说的是什么。但我担心,这可能会
混淆
爬虫
,而不是帮助我们的参考。
浏览 0
提问于2021-11-02
得票数 1
2
回答
将从unix shell传递到节点程序的字符串转换为javascript格式的字符串?
node.js
、
bash
/myNodeScript.
js
$testString 当我在node程序中将其捕获为process.argv[2]之后使用testString时,问题就来了--而不是将\n字符扩展到换行符node逐字打印它们
浏览 31
提问于2019-12-07
得票数 0
1
回答
我是不是在我的防爬行保护白名单中覆盖了主要的搜索引擎蜘蛛?
google
、
bing
、
googlebot
、
web-crawlers
根据微软的说法,"Bing今天有三个
爬虫
: bingbot,adidxbot,msnbot“。
浏览 0
提问于2011-06-08
得票数 5
2
回答
检查youtube链接的另一种方式?
c#
、
.net
、
asp.net-core
、
httpwebrequest
我正在创建一个应用程序,将检查内容中的断开链接。在youtube中有没有不同的方式来检查断开的链接?try HttpWebRequest request = WebRequest.Create(match.Groups[1].ToString()) as HttpWebRequest;
浏览 0
提问于2020-06-18
得票数 1
4
回答
语言向导被认为是有害的?
ide
、
code-generation
、
wizard
、
yagni
它们还可以
混淆
您的代码,并且是
反
YAGNI的。 总的来说,你认为巫师更有用还是更有害?
浏览 5
提问于2008-11-01
得票数 2
回答已采纳
2
回答
阻止爬网程序跟踪javascripts中的链接
javascript
、
jquery
、
web-crawler
somepath/template_1.html';//and so on现在,
爬虫
正在尝试跟踪这些链接
浏览 0
提问于2013-02-22
得票数 0
2
回答
PHP模糊-不同的值
php
我试图用不同的值
混淆
和ID (例如: 1)。你知道该怎么做吗?我既不希望
混淆
后的字符串始终具有相同的值(例如:1始终为ABC543),也不希望将
混淆
后的值保存到数据库中。
浏览 0
提问于2011-11-08
得票数 0
1
回答
通过模糊/模糊的安全性是一个有效的选项,还是爬行器启用了JavaScript?
javascript
、
html
、
obfuscation
、
obscurity
我正在创建一个新的网站,所以我正在考虑如何保护我的电子邮件地址和电话号码免受
爬虫
攻击,实际上我的意思是电子邮件收割机 (我认为其中大部分没有启用JavaScript,但我没有任何证据)。我现在所做的绝对是默默无闻或
混淆
(我可能
混淆
了这两个术语),因为我希望电子邮件地址通常是可见的,用户可以点击。我的问题是“安全SE”( Security ),因为我将在短期内将代码发送给“代码审查SE”: 默默无闻 /
混淆
是一个有效的选项,还是爬行器= 电子邮件收割机启用了JavaScript?m_clear_text + &
浏览 0
提问于2019-06-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
反爬虫探索(2)-反爬虫
反爬虫探索(3)-反爬虫平台Anticraw
实战反爬虫
爬虫与反爬虫的博弈
数据采集之爬虫、反爬虫、反反爬虫
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券