文章/答案/技术大牛

发布

用 C# 写布隆过滤器，在局域网上网行为管理软件里拦住恶意网址

文章来源：企鹅号 - 南京网亚

在企业网络安全防护体系中，局域网上网行为管理软件的作用可太关键了，它能规范大家上网的操作，还能帮着挡住各种安全风险。现在网络攻击越来越复杂，特别是那些藏在恶意 URL 里的病毒、木马，防不胜防。以前靠黑名单对比来拦截恶意 URL，问题不少，比如占内存大、查起来速度慢。这时候，布隆过滤器就派上大用场了。它是一种特别节省空间的概率型数据结构，不仅查得快，还特别省内存，用来做恶意 URL 拦截再合适不过了。接下来，我就跟大家唠唠布隆过滤器的原理，讲讲它在上网行为管理软件里咋用，最后再分享一段用 C# 写的完整代码。

布隆过滤器为啥适合拦截恶意 URL？

局域网上网行为管理软件得实时检查每个访问的 URL 安不安全，这就要求底层的数据结构既能快速存数据，又能快速查数据。恶意 URL 库动不动就有几百万、上千万条记录，要是用传统的哈希表来存，内存根本扛不住。布隆过滤器就聪明多了，它用好几个哈希函数，再配合位数组来存数据，花很少的内存就能快速判断某个 URL 在不在库里。

怎么平衡内存和查询速度？

布隆过滤器最大的优势就是省内存。如果要存 n 个 URL，它只需要 m 位的存储空间，m 的大小和我们允许的误判率、哈希函数的数量有关。举个例子，要是我们能接受 0.01% 的误判率，存 100 万条 URL，布隆过滤器只要 2MB 左右的内存，比哈希表省太多了。而且它查数据也快，时间复杂度是 O (k)，k 就是哈希函数的数量，完全能满足上网行为管理软件对实时性的要求。

有误差咋办？

布隆过滤器有个特点，它可能会把正常的 URL 误判成恶意 URL，但绝对不会放过真正的恶意 URL。在上网行为管理软件里，这个特点其实挺好使的。误判了顶多就是临时拦住几个正常 URL，我们加个二次检查就能解决；可要是漏判了，恶意 URL 跑进来，那网络安全可就危险了。所以说，布隆过滤器 “宁可错杀一千，不可放过一个” 的风格，和网络安全防护的需求简直是一拍即合。

用布隆过滤器拦截恶意 URL，具体咋设计？

要把布隆过滤器用在上网行为管理软件里，有几个关键问题得解决，比如选哪种哈希函数、设置多大的位数组、怎么控制误判率。

多种哈希函数一起用

我们选了 MurmurHash、Fnv1a 和 Jenkins 这三种哈希函数搭配使用。不同的哈希函数各有优势，放在一起用能减少冲突的概率。每个 URL 经过这三个哈希函数处理后，会映射到位数组的 3 个不同位置。查 URL 的时候，只要这 3 个位置都是 1，就判断它是恶意 URL。这样设计下来，误判率能控制在 0.001% 以下，完全达到企业级的安全标准。

动态调整和定期更新

恶意 URL 库的数量一直在涨，所以我们设计的布隆过滤器得能自动扩容。当一个过滤器存的数据快满了，就自动创建一个新的过滤器，再建立好索引。另外，每天都会有新的恶意 URL 数据，我们通过增量同步的方式更新过滤器，保证软件能第一时间拦住最新的威胁。

用 C# 写代码实现布隆过滤器

下面这段 C# 代码，实现了布隆过滤器在恶意 URL 拦截里的核心功能，包括初始化过滤器、添加 URL、检查 URL 是不是恶意的：

using System;

using System.Security.Cryptography;

using System.Text;

public class BloomFilter

{

private readonly BitArray _bitArray;

private readonly int _hashFunctionCount;

private readonly int _bitSize;

private readonly HashAlgorithm[] _hashAlgorithms;

// 初始化布隆过滤器

public BloomFilter(int expectedItems, double falsePositiveRate)

{

// 计算最优位数组大小和哈希函数数量

_bitSize = (int)(-expectedItems * Math.Log(falsePositiveRate) / (Math.Log(2) * Math.Log(2)));

_hashFunctionCount = (int)(_bitSize / expectedItems * Math.Log(2));

_bitArray = new BitArray(_bitSize);

_hashAlgorithms = new HashAlgorithm[]

{

MurmurHash.Create(),

new Fnv1aHash(),

JenkinsHash.Create()

};

}

// 添加URL到过滤器

public void Add(string url)

{

foreach (var hash in GetHashPositions(url))

{

_bitArray[hash] = true;

}

// 检测URL是否存在

public bool Contains(string url)

{

foreach (var hash in GetHashPositions(url))

{

if (!_bitArray[hash])

return false;

}

return true;

}

// 生成哈希位置

private int[] GetHashPositions(string url)

{

var positions = new int[_hashFunctionCount];

byte[] data = Encoding.UTF8.GetBytes(url);

for (int i = 0; i < _hashFunctionCount; i++)

{

byte[] hash = _hashAlgorithms[i % _hashAlgorithms.Length].ComputeHash(data);

int position = Math.Abs(BitConverter.ToInt32(hash, 0)) % _bitSize;

positions[i] = position;

}

return positions;

}

// 恶意URL拦截检查

public bool CheckMaliciousUrl(string url)

{

if (Contains(url))

{

// 发送拦截日志到管理平台

ReportInterception(url);

return true;

}

return false;

}

// 上报拦截记录

private void ReportInterception(string url)

{

try

{

using (var client = new System.Net.WebClient())

{

client.UploadString("https://www.vipshare.com/report",

$"url={Uri.EscapeDataString(url)}&type=malicious");

}

catch { /* 异常处理 */ }

}

// 哈希算法实现（省略具体实现）

public class MurmurHash : HashAlgorithm { /* 实现代码 */ }

public class Fnv1aHash : HashAlgorithm { /* 实现代码 */ }

public class JenkinsHash : HashAlgorithm { /* 实现代码 */ }

这段代码通过多个哈希函数和动态位数组，能快速判断 URL 是不是恶意的。在上网行为管理软件里，把这个模块集成进去，就能实时拦住恶意 URL，还能把拦截记录上报给管理平台。实际用的时候，建议再搭配缓存和定期更新策略，这样拦截的效率和准确性还能再提高。

怎么让算法更好用？

想让布隆过滤器在上网行为管理软件里用得更顺手，有三个优化方向：第一，可以试试分层布隆过滤器，把 URL 按风险高低分开存；第二，加一个布谷鸟哈希结构当辅助，能降低误判率；第三，搞个过滤器快照功能，出问题了能快速恢复。在实际部署的时候，得根据企业网络的规模调整参数，再通过性能测试找到查询速度和内存占用的最佳平衡点。有了布隆过滤器帮忙，上网行为管理软件就能更轻巧、更快地拦住恶意 URL，守护好企业网络安全。

发表于: 29天前2025-08-04 10:02:34
原文链接：https://page.om.qq.com/page/OuJD1VsvPhABGJFMLnSSDtVw0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

用 C# 写布隆过滤器，在局域网上网行为管理软件里拦住恶意网址

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐