首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Grab 构建基于大模型和 Agent 的自动数据分析平台实践

Grab 构建基于大模型和 Agent 的自动数据分析平台实践

作者头像
ApacheHudi
发布2025-11-12 14:31:29
发布2025-11-12 14:31:29
1400
举报
文章被收录于专栏:ApacheHudiApacheHudi

导读 作为东南亚市场头部超级应用,Grab 深度覆盖出行、外卖、金融科技等多元场景。受高频金钱激励活动与金融服务场景的双重驱动,平台风控需求尤为迫切——传统风控模式因数据孤岛现象突出、领域知识难以沉淀复用等痛点,已难以满足高效精准的风险防控要求。在此背景下,Grab 构建大模型驱动的智能体数据分析平台,通过"知识注入+流程重构"改变了风控分析的范式。本次分享题目为《基于大模型与智能体的复杂场景数据分析》。

主要介绍:

1. 风控场景下的分析师挑战

2. 大模型、智能体重塑风险分析范式

3. 智能体驱动的增强分析平台技术实现

4. 智能体驱动的增强分析平台业务实践

5. 对未来的展望

分享嘉宾|陈嘉 Grab Head of Data Science, Integrity and Core Experience

编辑整理|邱邱

内容校对|郭慧敏

出品社区|DataFun


01

风控场景下的分析师挑战

1. Grab 的风控业务背景

Grab 作为东南亚市场头部超级应用,深度覆盖出行、外卖、金融科技等多元领域。随着业务规模的持续扩张与市场渗透的不断深化,平台在用户增长与生态拓展过程中逐步衍生出丰富的业务场景与用户功能模块。在此背景下,两类核心业务特征对风控体系提出了更高要求:其一,为应对激烈的市场竞争,平台设计了多样化的用户增长激励机制(如新人补贴、任务奖励等),虽有效拉动了用户活跃度,但也吸引了大量黑灰产团伙(俗称“羊毛党”)通过批量注册、虚假交易等方式套取平台利益。需特别说明的是,在东南亚高度分散的市场竞争格局下,此类激励机制已成为平台维持用户粘性与市场份额的核心战略工具;其二,平台金融服务矩阵持续完善(涵盖电子钱包、信用卡绑定、二维码支付等多元场景),用户在享受便捷金融服务的同时,也衍生出信用卡盗刷、账户盗用、虚假交易等典型风险场景,对平台的风险防控能力提出了更高要求。

与国内相对集中的支付生态(主要由数家头部支付平台主导风控体系建设)不同,东南亚市场以信用卡支付为主流,且支付服务提供商高度分散,导致风险场景呈现碎片化、跨平台的特征,进一步加剧了平台的风险防控难度。

从风险触发的业务环节来看,风控覆盖范围突破单一支付场景限制,深度嵌入用户全生命周期的关键节点——无论是用户间的打赏小费、向客服发起的投诉申诉,还是涉及资金的对外支付提现等非支付类操作,均可能成为风险事件的衍生场景,这对风控体系的场景适配能力提出了更高要求。

在数据支撑层面,Grab 风控的数据来源呈现多源异构特征:既包含平台内生的交易流水、消费行为等核心业务数据,亦整合了设备信息、生物特征指纹、地理位置轨迹、WiFi 连接状态、信用卡前缀校验等外部线下数据,通过多维度数据的交叉验证,为风险识别提供更全面的信息基底。

从决策机制来看,当前风控策略主要依托“规则引擎+机器学习模型”。

2. 风控分析师在风控业务中的职责

风控分析师作为风控业务团队的核心角色,在风险防控体系中承担着关键职能,其核心职责可归纳为以下三方面:其一,快速响应风险事件,通过多维度数据溯源与逻辑推演精准定位风险根因,并制定针对性处置方案;其二,开展深度数据挖掘与业务洞察,通过结构化分析与规律提炼,输出可指导产品迭代优化与算法模型训练的策略建议;其三,深度参与风控规则引擎的设计与优化,或基于业务场景自主设计风险规则,完善风险防控策略体系。

由于需处理多源异构数据、快速响应突发风险事件并制定有效解决方案,风控分析师的专业能力面临较高要求。该岗位兼具高压力属性与高知识密集度。

3. 传统风控分析的问题

伴随业务规模的持续扩张与场景复杂度的不断提升,风控业务对专业分析人力的需求呈指数级增长。然而,团队内部的人员流动性问题,一方面导致隐性经验难以有效沉淀,形成过度依赖个别专家的“人治”模式,制约团队能力的规模化复制与扩展;另一方面,人工操作过程中不可避免的主观偏差与操作失误,易引发分析效率瓶颈及决策失当风险。

02

大模型、智能体重塑风险分析范式

1. 风险分析的范式

传统风控分析遵循典型的"假设-验证-决策"方法论:分析师基于业务经验或风险直觉提出初始假设(如"某异常交易可能为盗刷"),继而通过多维度数据提取、清洗与分析对假设进行验证;若验证结果与假设不符,则调整假设方向并重复验证过程,直至锁定关键风险因子并输出解决方案。这一过程本质上是多轮迭代探索的过程,其效率与准确性高度依赖分析师的经验储备——经验丰富的分析师可通过更精准的风险直觉缩小假设范围,减少验证次数,从而快速达成有效决策。

2. 大模型与智能体如何重塑分析师的范式

判断智能体能否有效替代风控分析师的核心在于精准识别大模型与智能体的能力边界与局限性,进而明确其可替代的具体场景。

从技术特性看,大模型的核心优势体现在三方面:其一,具备强大的记忆容量,可存储多模态知识并支持快速检索;其二,拥有自然语言理解与生成能力,能实现复杂语义的解析与输出;其三,具备多维度逻辑推理能力,可处理非结构化数据间的关联分析。然而,其固有局限性亦需重点关注——受限于预训练数据的覆盖范围,大模型易产生“知识幻觉(Knowledge Hallucination)”,即当问题超出预训练知识边界时,可能生成与事实不符的虚构内容。

智能体作为大模型的应用延伸,天然继承了其核心能力(如复杂推理、多轮对话),同时也无法规避其固有局限性(如知识幻觉、复杂任务精度衰减)。具体而言,智能体在工具调用任务中表现出类似分类器的特性——随着问题复杂度的提升,其任务执行的准确率会显著下降。

基于上述分析,寻找智能体替代风控分析师的可行切入点需满足两个关键原则:一是务实性,即聚焦当前技术可支撑、业务痛点最突出的场景;二是可扩展性,即确保未来大模型能力升级时,系统无需大规模重构即可适配新能力。结合风控业务需求,当前最具潜力的两大切入点为“知识注入”与“流程注入”。

有了大模型和智能体的引入,原来的分析问题到解决方案的路径演变成分析师和大模型协同的过程。分析师的工作重点转变为:帮助构建知识、流程;在和大模型交互的过程中,监控、激发模型的能力。

03

智能体驱动的增强分析平台的核心技术

1. 增强分析平台的架构

图中左侧展示了智能体的核心架构,其设计逻辑可概括为:以大模型为核心控制中枢,通过驱动多样化插件实现功能扩展。其中,部分插件本身即为智能体,这类智能体内置大模型驱动的分析流程,支持调用其他智能体或外部服务完成复杂任务。考虑到大模型能力的持续演进,框架在设计初期即注重模块化与扩展性,通过松耦合架构设计确保未来技术升级时可快速适配新能力。

针对风控分析师的业务需求,产品形态采用“数据层+界面层”的分层架构:数据层负责整合多源异构数据(如交易记录、设备信息、行为日志等),为上层分析提供标准化数据支撑;界面层的设计核心聚焦于实时对话交互,通过自然语言交互界面降低操作门槛,使分析师的思考与分析流程更流畅,避免在司机端、用户端等多系统间频繁切换取数,显著提升分析效率。

2. 核心技术一:智能体链接业务知识

智能体业务知识链接的核心技术:RAG 与精细化知识注入

智能体实现业务知识与模型能力有效链接的核心技术路径,主要依托检索增强生成(Retrieval-Augmented Generation, RAG)技术,并辅以模型微调(Model Fine-tuning)方法。在知识注入的具体实践中,我们针对风控业务场景的特殊性进行了精细化处理,重点整合了两类关键知识资源:

其一为非结构化业务文档类知识,涵盖历史风险问题分析报告、企业内部风险讨论群组聊天记录、风险评估文档等。此类知识承载了风控分析师长期积累的实战经验与隐性认知,通过 RAG 技术的语义匹配与上下文关联,可将其转化为模型可理解的结构化信息,有效补充大模型在垂直风控领域的知识盲区。

其二为结构化数据元信息类知识,包括数据字典(字段定义、取值范围等元数据)、历史SQL查询语句(高频风险特征提取逻辑)等业务数据相关的结构化描述。此类知识直接关联底层数据的语义与逻辑,通过 RAG 的精准检索与关联,可帮助模型更准确地理解数据上下文,避免因“数据幻觉”导致的分析偏差。

通过上述多维度、精细化的知识注入策略,智能体得以深度链接业务知识,显著提升其在复杂风控场景下的分析可靠性与决策准确性。

3. 核心技术二:智能体执行复杂任务

智能体执行复杂风险分析任务的核心技术在于标准操作流程(Standard Operating Procedure, SOP)的调度与控制逻辑。科学的 SOP 设计不仅能支撑风险分析任务的高效执行,更因其良好的通用性,可拓展应用于风控场景之外的其他复杂业务流程。

本方案中 SOP 设计的核心思想是采用层次化树状结构,该结构高度模拟人类处理复杂问题时的思维模式——从目标拆解到步骤执行,从信息收集到决策判断,均遵循“分层递进、分支决策”的逻辑路径。与传统通过固定代码硬编码实现的线性流程不同,该树形结构由大模型动态驱动生成,其每一步操作逻辑由当前步骤的输入动态决定,具体涉及两类关键输入:用户的问题查询指令与工具调用反馈结果。基于对这两类输入的综合推理分析,大模型可自主决策下一步操作(如继续调用数据核查工具、调整分析方向或输出初步结论),从而实现对复杂风险分析任务的灵活、自适应执行。这种“大模型驱动+树状 SOP”的设计模式,既保证了流程的可解释性,又通过动态调整能力提升了复杂场景下的任务完成质量。

04

Grab 风控场景下的业务实践

1. 案例一:Analytics Copilot-RAG 赋能的自助分析机器人

Analytics Copilot 的核心目标是赋能用户提升分析能力:一方面助力风控分析师深化复杂问题分析效能,另一方面支持非专业用户自主完成基础风险分析任务。

其整体运行流程如下:Data-Arks 作为多源数据交互中间件(MCP),为 SpellVault 智能体框架提供标准化 API 接口;SpellVault 通过插件机制实现数据获取、动作执行及问题应答;最终用户可通过 Slack 或 WebUI 完成交互操作。

如图所示为用户实际操作示意图,典型场景如下:

  • 风险规则匹配查询:用户可通过自然语言提问(如“某用户是否触发风控规则?具体涉及哪些条款?”),系统依托历史经验的结构化沉淀与 RAG 技术的知识增强能力,快速完成规则匹配分析并反馈结果;
  • 数据查询与分析:支持直接发起数据查询与分析任务(如“近 7 日某地区异常交易分布”),无需通过多轮交互提交取数需求,系统自动调用数据接口完成处理并返回可视化分析结论。

未来可持续进化的方向:一方面,多模态的能力支持图像等文字之外的输入形式。另一方面,引入更多企业工作(如 CRM、财务系统),实现更全面的数据分析能力。

2. 案例二:RiskOps Autopilot-SOP Agent 驱动的风险运营自动化

有经验的分析师对于业务场景、解决方案比较熟悉,但是团队规模无法满足业务增长的诉求,因此如何固化业务知识非常重要。

SOP 的定义支持以纯文本形式进行,支持非技术人员直接编写,显著降低分析师的输出成本。相较于需通过代码固化的传统模式(调整时需跨部门协调),SOP 的维护成本更低。

技术层面,通过深度优先算法将纯文本 SOP 解析为树状结构:基于当前节点的子树特征生成提示词,结合模型输出与工具调用结果动态确定遍历路径,最终实现从自然语言描述到结构化树表达的转换。

RiskOps Autopilot-SOP Agent 在信用卡异常停用核查、风险报告生成等业务场景中,实现了流程的高效自动化与交付质量的显著提升。在预定义 SOP 覆盖的业务范围内,AI 的平均执行效能优于人工水平:例如,经验较浅的分析师易因疏漏导致步骤缺失,AI 的介入可有效弥补此类能力短板,推动风险运营能力的整体升级。

通过几种实现方案的对比,再次解释下为什么要用树结构 SOP?代码实现的需要工程师资源较多、灵活性、维护性都较差;有向图 workflow 的灵活性不够,且无法定义复杂情况;树结构兼顾了灵活性和准确性。此外,后续大模型的能力提升后,树结构这种方式可以充分的发挥大模型的价值。

05

对未来的展望

传统风控分析师需全程参与风险分析全流程。未来,分析师与AI将形成深度协作模式:通过将领域知识注入 AI 系统,使其承担 90% 的重复性分析工作(如基础数据核查、规则匹配等),分析师则聚焦于 10% 的关键决策(如复杂风险定性、策略优化等)。

从能力演进看,过往分析师的核心职责集中于问题描述、归因分析及策略执行;当前大模型已能辅助完成基础分析工作,但规则制定、模型调用等核心决策仍由分析师主导;未来,智能体将进一步深度融入问题解决链路,通过自主执行复杂分析任务(如多维度风险关联挖掘、动态策略生成),推动分析师角色向“决策中枢”升级,实现从“执行主导”到“智能协同”的能力跃迁。

以上就是本次分享的内容,谢谢大家。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ApacheHudi 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档