Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >防止恶意爬虫/刮板和DDoS攻击的方法

问防止恶意爬虫/刮板和DDoS攻击的方法
EN

Server Fault用户

提问于 2011-10-13 23:40:08

回答 2查看 1.7K关注 0票数 0

从过去的几周开始，我在我的网站上经历了机器人攻击。基本上，爬虫在网站上运行的频率很高，导致负载增加。这会导致带宽消耗，从而给其他人带来糟糕的用户体验。我想知道像谷歌、亚马逊和电子海湾这样的网站是如何防止这些事情的：

它们如何区分有用的爬虫(google/yahoo/msn)和不遵循robots.txt和其他规则的恶意爬虫？
如何通过检查apache访问日志来识别可能导致实时有害的机器人的模式？

不能设置诸如连接或数据包/时间/ip之类的阈值，因为这将导致站点上的适当客户的用户体验较差。

1元体验云点播

覆盖建站/短视频等热门场景，提供媒资管理、短视频 SDK、小程序插件和播放器云+端一体化能力，助您抓住视频风口

EN

回答 2

Server Fault用户

发布于 2012-02-12 09:32:20

以下是我所做的，以及我的建议：

创建在cron上运行1-5分钟的脚本:读取原始访问日志(例如，最后20,000行--取决于站点的活动情况)，根据IP/主机名组织数据，然后按unix时间组织数据，并附带结果。循环遍历结果，并确定哪个IP没有向已知和必需的页面元素(如图像、js、css等)发出任何请求。从这些请求中，计算出在一秒钟内发出了多少个页面请求。我会将4页请求或更多的请求描述为过度和滥用。从这里，检查好的机器人的白名单(preg_match与主机名对应的东西，如"googlebot.com“等)，并将结果的所有ip和主机名都存储到数据库中。

在显示/处理任何内容之前，创建在每个页面上运行的另一个脚本。让它验证所请求的页面是否来自被禁止的IP数据库中的IP。如果是的话，返回一个带有captcha表单的403，提示用户提交重新审议。如果他们这样做了，并且它是有效的，让脚本解除他们。如果它们未被禁止，则将其存储在会话中，以避免对访问者进行重复验证。

最后，在服务器上安装monit，并将其配置为每分钟监视一次http。如果服务器没有响应，它将自动重新启动。这将有助于最大限度地减少停机时间和极端滞后。我上面描述的脚本将自动识别刮板和坏的机器人，并撤销访问权限。如果有重新审议的请求，它也将自动处理。

票数 1

EN

Server Fault用户

发布于 2012-10-27 06:08:16

像Cloudflare或Project HoneyPot这样的解决方案应该能做到这一点。看看这个还有几个指针- https://drupal.stackexchange.com/questions/45678/watchdog-404-page-not-found-entries-from-spambot-guessing-urls/48448#comment50114_48448

票数 0

EN

页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://serverfault.com/questions/321383

复制

相关文章

HTML UTF-8 货币符号

<p>我将显示 €<p> <p>我将显示 €<p> <p>我将显示 €<p>

用户4047016

2019/11/05

2.5K0

HTML UTF-8 货币符号

国际化之货币符号显示

我发现手机上显示的货币符号跟实际遇到的可能不一样，为此我逐一查询了不同国家/地区的显示。大部分是确定的，有几个国家不太确定。

meteoric

2018/11/20

1.4K0

散点自定义符号——在散点图中创建自定义椭圆符号。

from matplotlib import colors as mcolors, path from matplotlib.collections import RegularPolyCollection import matplotlib.pyplot as plt from matplotlib.widgets import Lasso import numpy as np class Datum: colorin = mcolors.to_rgba("red") colorou

裴来凡

2022/05/28

5110

散点自定义符号——在散点图中创建自定义椭圆符号。

iOS小技能：金额格式处理 (货币符号本地化)

https 网络安全 ios python 文件存储

iOS 系统自带格式化NSFormatter的常用子类有：NSNumberFormatter（数字格式化）、NSDateFormatter（NSISO8601DateFormatter日期格式化）、NSPersonNameComponentsFormatter（名片格式化）、NSMeasurementFormatter（数量单位格式化）。

公众号iOS逆向

2022/08/22

2.3K0

iOS小技能：金额格式处理 (货币符号本地化)

Js/JQuery将数字金额转换为其他国家货币格式（包括货币符号和千分符）

javascript currency

如上述js，其他国家只需要更换NumberFormat中对应的国家currency及国际化地区语言码即可.立即查看各国对照表

目的地-Destination

2023/03/06

1.3K0

使用CSS ::marker的自定义项目符号

css html android ios

现在，在使用 <ul> 或 <ol> 时自定义数字或项目符号的颜色，大小或类型很简单。

张张

2020/11/23

1.9K0

使用CSS ::marker的自定义项目符号

android自定义钟表android自定义钟表

接下来就是设定这个自定义View的大小，在没有大小自适应的时候，view的高度我这位整个手机屏幕高度的三分之一，宽度为整个屏幕的宽度

HelloJack

2018/08/28

1K0

android自定义钟表android自定义钟表

android 自定义控件 attrs,android 使用attrs自定义控件

canvas xml android http

1、在values下新建一个attrs.xml的资源文件(my_attrs.xml)

全栈程序员站长

2022/11/02

8350

加密货币: 数字货币如何改变金融

比特币数字货币

上周，Twitter首席执行官Jack Dorsey宣布，他同时经营的金融公司Square将推出一个新的平台，将使用比特币创建去中心化金融项目。在这些天马斯克围绕加密货币习惯性的、持续的网络噪音输出中，你能不给Dorsey的举动以时间吗？Square的项目最终可能会作为一个分水岭被记住，而那也会是去中心化金融，或 "DeFi"，最终进入主流的时刻。

用户7358413

2021/07/25

1.1K0

Android自定义Dialog

android jquery ui 网站

在开发中，我们经常会用到一些自定义布局的对话框。每次自己写的时候，经常会遇到一些细小的问题需要上网来解决，所以干脆把经常遇到的几个问题总结了一下，这样就可以愉快自定义dialog了。本文主要总结的问题有：1.对话框的大小、位置 2.对话框的主题

developerHaoz

2022/05/13

1.2K0

Android自定义Dialog

Android自定义控件

java 面向对象编程 kotlin 编程算法

时隔一年，用新知识重构一个老库一年前，用 Java 写了一个高可扩展选择按钮库。单个控件实现单选、多选、菜单选，且选择模式可动态扩展。

前端小tips

2021/11/28

5.9K0

Android 自定义 Snackbar

xml android 面向对象编程

Snackbar： Android 官方的一个控件，在 Android 应用中也算很常见了，用来显示应用交互中正在发生的消息，跟 Toast 类似，又有所区别，关于它的简单介绍和使用见上篇。Android 关于 Snackbar 基本使用。

用户8928967

2023/02/28

1.7K0

Android 自定义 Snackbar

android自定义控件

Android为开发者提供了大量的控件，这些控件只能满足一般性的需求，有时候需要开发者重新定制控件。控件的定制有三种形式：对原有控件的重写；对原有控件进行组合；自定义新的控件。Android中所有控件类都是View的子类。本例主要是讲一个自定义时钟控件，该控件直接继承View类。 1.控件类首先需要编写控件类，该类继承View类，并实现接口Runnable。时钟控件主要包含的参数：clockimageresourceid，scale，handcenterwidthscale，handcenterheig

水击三千

2018/02/27

1K0

android自定义属性

1、引言对于自定义属性，大家肯定都不陌生，遵循以下几步，就可以实现：自定义一个CustomView(extends View )类编写values/attrs.xml，在其中编写styleable和item等标签元素在布局文件中CustomView使用自定义的属性（注意namespace）在CustomView的构造方法中通过TypedArray获取 ps:如果你对上述几个步骤不熟悉，建议先熟悉下，再继续~ 那么，我有几个问题：以上步骤是如何奏效的？ styleable 的含义是什么？

xiangzhihong

2018/02/01

2.2K0

android 自定义相机

android github https api

老规矩，先上一下项目地址：GitHub：https://github.com/xiangzhihong/CameraDemo 方式：调用Camera API 自定义相机调用系统相机由于需求不同，所以选择的方案固然也不同，至于第二种调用系统相机，这里就不过多讲解了，使用Intent对象设置一个Action动作即可，跳转时使用startActivityForResult，然后在onActivityResult处理相关数据便可，关键代码： intent.setAction("android.me

xiangzhihong

2018/02/01

3K0

Android 自定义View

canvas api 编程算法 textview android

这篇文章是一个自定义View的学习总结文章，会介绍自定义view的整体流程和部分相关的api使用，并不会对所有使用到的api进行介绍，所以阅读的话需要有一些Android的开发基础。

艳龙

2022/05/13

4700

Android 自定义View

Android自定义GLSurfaceView

当我们需要把同一个场景渲染到不同的Surface上时，此时系统GLSurfaceView 就不能满足需求了，所以我们需要自己创建EGL环境来实现渲染操作。注意: OpenGL整体是一个状态机，通过改变状态就能改变后续的渲染方式，而 EGLContext（EgL上下文）就保存有所有状态，因此可以通过共享EGLContext 来实现同一场景渲染到不同的Surface上。

曾大稳

2018/09/11

1.7K0

Android自定义GLSurfaceView

android 自定义Lint

概述 Android Lint是Google提供给Android开发者的静态代码检查工具。使用Lint对Android工程代码进行扫描和检查，可以发现代码潜在的问题，提醒程序员及早修正。为什么要自定义我们在实际使用Lint中遇到了以下问题：原生Lint无法满足我们团队特有的需求，例如：编码规范。原生Lint存在一些检测缺陷或者缺少一些我们认为有必要的检测。对于正式发布包来说，debug和verbose的日志会自动不显示。基于上面的考虑，我们开始调研并开发自定义Lint。开发中我们希望开发者使用R

xiangzhihong

2018/02/06

1.5K0

android 自定义Lint

Android自定义View

前几天在郭霖大神的博客上看了自定义View的知识，感觉受益良多，大神毕竟大神。在此总结一下关于Android 自定义View的用法：

指点

2019/01/18

6090

点击加载更多

相似问题

Android货币符号排序

10

Android:将货币符号转换为货币代码

12

返回不同货币符号的Android货币格式

11

在Android上检索货币符号

16

货币符号的货币格式

12

活动推荐

提供高质量视频生成与处理服务，效果专业

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例