特性介绍
DatabaseClaw 是腾讯云数据库 AI 服务推出的 AI Agent 数据库运维平台,面向 DBA 团队提供对话式智能运维能力。平台通过部署在用户私有网络(VPC)内的 AI Agent 实例,直连云数据库,结合大语言模型的自然语言理解能力和可插拔的运维技能(Skill)体系,让 DBA 通过自然语言对话即可完成数据库诊断、巡检、慢查询分析、空间分析等日常运维任务,无需手动编写脚本或逐页查看监控面板,从根本上降低数据库运维门槛,提升运维效率。
特性优势
对话即运维:自然语言驱动的零门槛操作
自然语言交互:DBA 无需学习复杂的操作界面或编写诊断脚本,通过自然语言描述运维需求(如“帮我检查当前数据库的健康状况”、“分析最近1小时的慢查询”),AI 助手自动理解意图并执行对应操作,大幅降低运维操作门槛。
安全可控:VPC 内网部署与多层防护
数据不出域:DatabaseClaw 实例部署在用户 VPC 内网,通过内网直连数据库,所有运维数据在用户网络环境内闭环流转,不经过公网传输,满足数据安全合规要求。
操作分级确认:对运维操作按安全等级分为 L1(只读)、L2(低风险)、L3(中风险)、L4(高风险)四级。L3/L4 级操作(如数据变更、参数修改)在执行前展示确认卡片,需用户手动确认后才会执行,可有效降低误操作风险。
高危操作拦截:服务角色绑定
QCloudTDAIDatabaseClawDenyDestructive 策略,从 IAM 层面显式拒绝销毁、清空、删库等不可逆高危操作,可有效降低因 AI 助手被诱导而执行危险操作的风险。能力可扩展:Skill + SOUL + 模板的三维配置体系
Skill 技能插件化:运维能力以 Skill 形式封装,支持管理员自建上传或从 SkillHub 市场一键导入。每个 Skill 封装一项独立的运维能力(如巡检、慢查询分析、空间分析),按需安装、灵活组合,团队可根据业务场景定制专属的运维技能栈。
SOUL 行为可定义:通过 SOUL 配置定义 AI 助手的身份、行为准则、回答风格和能力边界,不同团队可根据自身规范定制差异化的 AI 助手人格,如“严谨的生产环境 DBA 专家”或“友好的开发环境助手”。
模板标准化创建:将 Skill + SOUL 配置保存为实例模板,用户端创建实例时一键复用,实现团队级配置标准化,避免逐个实例手动配置。
团队协同:管理端集中管控与运营洞察
运营概览 Dashboard:管理端首页实时展示团队整体使用情况(总对话数、Skill 执行次数、成功率)、Skill 装配排行和全部实例运行状态,帮助管理员快速发现异常实例和低效 Skill。
权限分层管理:基于腾讯云 CAM 实现用户(DBA)和管理员两种角色的权限隔离。用户专注于日常运维,管理员负责全局配置管控,各司其职。
实现原理
整体架构
DatabaseClaw 采用“管理端统一配置、用户端按需创建、VPC 内 Agent 执行”的三层架构。
AI 对话的处理流程
用户发送消息后,系统按以下流程完成从自然语言到运维执行的全链路处理。
1. 意图识别:用户消息发送至大语言模型,结合 SOUL 中定义的行为准则和已安装 Skill 的描述信息,理解用户的运维意图。
2. Skill 匹配:模型从已启用的 Skill 池中选择最匹配的 Skill,并基于用户输入自动构造调用参数。若无匹配 Skill,模型直接以知识进行回答。
3. 安全分级:根据 Skill 的安全等级分类评估操作风险,L1(只读查询)和 L2(低风险操作)直接执行,L3/L4(数据变更等高风险操作)需用户在确认卡片中手动确认。
4. 执行与返回:Skill 引擎通过已配置的数据源从 VPC 内网连接目标数据库,执行运维操作,执行过程和结果实时流式返回至对话界面,支持 Markdown 渲染。
实例创建与部署流程
1. 参数校验:校验 DatabaseClaw 名称合规性、地域可用区合法性、VPC/子网存在性。
2. 服务角色:检查账号下是否已创建默认服务角色,若未创建则触发自动创建并绑定策略(CVM 只读 + MySQL/Distributed Cache/MongoDB/TDSQL-C 读写 + 高危操作 Deny)。
3. 集群部署:在目标地域和 VPC 下创建或复用容器服务(TKE)集群,创建 Claw Agent Pod。
4. 能力初始化:根据用户选择的配置方式(快速创建/模板/自定义)加载对应的 Skill 列表和 SOUL 配置。
5. 状态就绪:部署完成后实例状态从创建中自动流转为运行中,用户可进入对话。
凭证与安全体系
DatabaseClaw 通过双凭证体系保障数据库连接安全:
凭证类型 | 用途 | 获取方式 | 安全机制 |
第一类凭证(平台凭证) | 查询云数据库实例列表、获取实例信息等平台级操作。 | 首次创建实例时自动创建 CAM 服务角色。 | CAM 策略控制 + 高危操作 Deny |
第二类凭证(数据库凭证) | 连接数据库实例执行诊断和运维操作。 | 用户在数据源管理中手动配置。 | KMS 加密存储 + 脱敏展示 + HTTPS 传输 |
应用场景
日常数据库巡检与健康监控
DBA 团队可为每个业务线创建独立的 DatabaseClaw 实例,通过定时任务功能配置每日自动巡检(如凌晨2点执行“对所有 MySQL 实例执行健康巡检”),系统自动生成巡检报告。DBA 上班后通过对话查看巡检结果,针对异常项进行追问诊断,实现从被动告警响应到主动健康管理的转变。
慢查询分析与性能优化
当数据库出现性能抖动时,DBA 无需登录多个监控平台逐一排查,只需在 DatabaseClaw 对话中输入“分析最近1小时的慢查询”,AI 助手自动调用慢查询分析 Skill,连接数据库获取慢日志数据,输出 Top SQL 列表、执行计划分析和优化建议,DBA 可直接基于建议执行优化操作。
团队标准化运维管理
管理员在管理端通过 Skill + SOUL + 模板三维配置体系,为不同团队预设标准化的运维配置方案。例如为生产环境团队配置“严谨模式 SOUL + 巡检/慢查询/空间分析 Skill”,为测试环境团队配置“宽松模式 SOUL + 全量 Skill”,用户端创建实例时选择对应模板即可一键完成配置,确保团队运维操作的规范性和一致性。
功能总览
用户端
功能模块 | 功能说明 |
实例管理 | 创建、查看、隔离和重启 DatabaseClaw 实例。支持按状态筛选和关键字搜索。 |
AI 对话 | 通过自然语言与 AI 助手对话,自动匹配 Skill 执行运维任务。支持流式结果展示、操作确认、会话管理。 |
数据源管理 | 为 DatabaseClaw 实例添加、编辑、测试和删除数据库连接。支持 MySQL、Distributed Cache、MongoDB、TDSQL-C MySQL 四种数据库类型。 |
定时任务 | 配置周期性运维任务(每小时/每天/每周/每月),自动执行巡检、分析等操作。支持启停和执行历史查看。 |
Skill 管理(实例级) | 启用或禁用当前实例已安装的 Skill,控制 AI 助手的可用运维技能范围。 |
SOUL 编辑(实例级) | 编辑当前实例的 AI 助手行为规范,修改仅影响当前实例,不影响管理端模板。 |
管理端
功能模块 | 功能说明 |
运营概览 | Dashboard 实时展示团队使用情况(总对话数、Skill 执行次数、成功率)、Skill 装配排行和全部实例状态列表。 |
Skills 管理 | 管理全局 Skill 技能池。支持自建上传(.zip/.tar.gz,最大50MB)和从 SkillHub 市场一键导入。支持启用/禁用/删除。 |
SOUL 管理 | 管理 SOUL 模板池。分为预设(不可编辑)和自定义(可编辑)两类。 |
实例模板 | 将 Skill + SOUL + 凭证配置保存为模板快照,用户端创建实例时可一键复用,实现标准化创建。 |
用户管理 | 查看团队成员的用户列表和用户组信息。权限变更跳转 CAM 控制台完成。支持管理员和用户两种角色。 |
使用限制
数据库类型:当前支持云数据库 MySQL、分布式缓存数据库(Distributed Cache)、云数据库 MongoDB 和 TDSQL-C MySQL 版。
网络要求:DatabaseClaw 实例部署在用户 VPC 内,需提前创建私有网络和子网。地域和可用区创建成功后不支持切换。
权限要求:使用用户端需授予
QcloudDatabaseClawUserFullAccess 策略,使用管理端需授予 QcloudDatabaseClawAdminFullAccess 策略。Skill 包限制:自建 Skill 包支持 .zip/.tar.gz 格式,最大50MB。