首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >基于AI的域名发现方式

基于AI的域名发现方式

作者头像
OneTS安全团队
发布2025-11-12 16:28:14
发布2025-11-12 16:28:14
860
举报
文章被收录于专栏:OneTS安全团队OneTS安全团队

声明

本文属于OneTS安全团队成员zimudao的原创文章,转载请声明出处!本文章仅用于学习交流使用,因利用此文信息而造成的任何直接或间接的后果及损失,均由使用者本人负责,OneTS安全团队及文章作者不为此承担任何责任。

基于大模型的域名发现方式

一、使用方式:

python3 domain_ai.py honor.txt --expport-prompt

即可仅返回提示词结果

python3 domain_ai.py honor.txt --no-ai

使用默认小模型计算结果

python3 domain_ai.py honor.txt

正常运行并输出结果

二、技术原理

·模板化提示词

·场景化

·行业特定词库

·通用服务词库

·深度学习

·主动学习迭代优化参数(300轮+无监督学习)

·公司画像

·增量学习

·。。。。。等等

三、模板化提示词

有一个基础提示词模板,大概2000多行,4w+多字,主要描述功能、思考模式、工作流程等。

深度学习分析当前域名结果,对基础模板的功能进行部分启用

部分模板提示词内容

# AI域名智能猜测工具生成提示词 ## 上下文说明 - **任务描述**:基于输入的域名样本,通过AI智能推理批量扩展相关域名,用于安全测试和资产发现 - **相关代码或文件**:将使用 @file 语法进行临时引用(如需要) - **参考规范**:遵循《打码了》、《打码了》和《打码了》 --- ## 你的角色(协调员智能体) 你是一名专业的AI域名推理协调员,负责统筹四个专业子智能体完成域名扩展任务: 1. **架构智能体** – 设计域名扩展的高层级方法论和分类体系 2. **研究智能体** – 收集《打码》、《打码》和《打码》 3. **推理智能体** – 基于规则和模式批量生成相关域名 4. **验证智能体** – 评估生成结果的质量、相关性和风险等级 ### 核心能力 - 精通常见互联网业务与命名规范 - 能根据有限样本,融合业务逻辑、地域、部门、功能、历史经验等模式,推演出结构化、高关联的域名 - 熟悉大模型API能力与输入输出约束,优化批量推理流程与结果验证 - 尊重业务安全性,扩展过程中注意避免虚构敏感信息、不规范词汇 ### 工作流程(多代理协作) 1. **逐步思考**:列出假设和未知因素 2. **子智能体协作**:对每个子智能体明确分配任务,获取其输出,并总结关键见解 3. **超级思考反思**:结合所有见解形成连贯的解决方案 4. **迭代优化**:如有缺漏,继续迭代(重新启动子智能体)直到确信无误

四、场景化

对于不同数据集应用不同规则

**Honor特征**: - DR地域(drcn/dra/dre/drru) - Portal系列(30+种portal) - 平台化架构(.cloud/.platform/.learning等13个平台) - 无分隔符环境后缀(《打码》格式) **Zhongan特征**: - 特殊前缀(za-, zat-, t-, dm-) - 云可用区(sg/ap3/ap5/eu1/de) - 业务系统模块复杂(《打码》) - 扁平化(95%是单层子域名) **Baidu特征**: - 流媒体编号(push1-20, hls1-20) - 城市地域(bj/gz/su) - 深度嵌套(service.region.platform.ROOT) - 巨大的词库(5674个不同词)

五、行业特定词库

行业特定词库(金融、电商、云服务。。。)

例如平安壹账通为金融属性,启用金融行业的特定词库。金融词库举例如下

- 金融词库: - 金融系统:finance、financial、fintech、banking、payment、wallet、fund、asset - 示例:finance.a.com、fintech.a.com、wallet.a.com、fund.a.com - 说明:财务系统、金融科技、支付钱包、资金管理等 - 支付相关:pay、pays、payment、payments、paygateway、alipay、wxpay、unionpay - 示例:pay.a.com、payment.a.com、paygateway.a.com - 说明:支付系统、支付网关、第三方支付等 - 资金/贷款:fund、funds、loan、loans、credit、deposit、withdraw、balance - 示例:fund.a.com、loan.a.com、credit.a.com - 说明:资金管理、贷款系统、信用/存款/提现等 - 发票/账单:invoice、invoices、bill、bills、billing、receipt、statement - 示例:invoice.a.com、bill.a.com、billing.a.com - 说明:发票系统、账单管理、结算单据等 - 数据平台:data、dataplatform、datacenter、dw、datawarehouse、bigdata、analytics - 示例:data.a.com、datacenter.a.com、bigdata.a.com、analytics.a.com - 说明:数据平台、数据中心、数据仓库、大数据分析等 - 统计/报表:stat、stats、statistics、report、reports、bi、dashboard、metrics - 示例:stat.a.com、report.a.com、bi.a.com、metrics.a.com - 说明:统计分析、报表系统、商业智能、指标监控等 - 扩展策略:功能后缀(data-api、finance-admin)、业务组合(pay-finance、data-report)、前缀标识(bi-dashboard、big-data)

六、通用服务词库

通用词库就是默认所有数据都会启用的,但启用方式还是会贴合企业命名方式等。例如荣耀习惯使用sg、ru等国家缩写、贝壳习惯使用拼音的首字母缩写(石家庄:sjz)。

七、性能指标

域名带test和prd等环境关键词非常常见,但是跑的结果发现测试反推生产几乎不存在。

测试关键词反推其他测试关键词命中率60%左右

编号类扩展如test1反推test2命中率90以上

等等,还有许多比较有意思的现象。

| 项目 | 优化前 | 优化后 | 减少 | |------|-------|-------|------| | Prompt样本数 | 2000个 | 50个 | -97% | | 模式描述 | 详细枚举 | 正则模式 | -85% | | 总Token消耗 | ~50k | ~10k | **-80%** |

| 数据集 | 基线 | 命中数 | 提升 | |--------|------|--------|------| | Honor | 123 | 191 | **+68** | | Zhongan | 141 | 269 | **+128** | | Baidu | 30 | 376 | **+346** |

| 数据集 | 基线 | v8优化 | 提升 | |--------|------|--------|------| | Honor | 13.2% | 20.4% | **+54%** | | Zhongan | 14.1% | 26.9% | **+91%** | | Baidu | 0.9% | 11.1% | **+1133%** |

等有空了拿一些常用工具进行对比试试(TODO)

后续扩展

后续对市面上优秀的开源工具作为数据的补充,目前数据集使用荣耀、众安、金融壹账通的域名公开域名数据进行测试和训练,腾讯、百度和贝壳的数据为辅助。

域名发现只是这套系统的一个功能,通过理解业务预测相似路由、预测账号密码等也在探索中。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OneTS安全团队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基于大模型的域名发现方式
  • 二、技术原理
    • 三、模板化提示词
    • 四、场景化
    • 五、行业特定词库
    • 六、通用服务词库
  • 七、性能指标
  • 后续扩展
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档