首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

奇富科技攻克零样本学习难题 全球首个基于多模态大语言模型的TRIDENT框架引爆IJCAI2025

近日,奇富科技联合北京交通大学发表的论文Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning,凭借大语言模型与零样本学习的颠覆性创新,从5404篇论文中杀出重围,强势登顶人工智能“奥林匹克" IJCAI2025会议。这是全球首个将多模态大语言模型(MLLM)深度应用于组合零样本学习的技术突破,有望推动我国在AI基础技术与产业应用深度融合方面占据先发优势。

IJCAI(即国际人工智能联合会议,International Joint Conference on Artificial Intelligence)是人工智能领域最主要的国际学术会议之一。IJCAI是中国计算机学会(CCF)推荐的A类国际学术会议,也是人工智能领域历史最悠久的顶级学术会议之一,迄今已举办了34届。本届论文通过率为19.3%,相当于每5篇投稿就有4篇被拒之门外。

正是在IJCAI这一顶尖学术平台的严苛筛选下,奇富科技聚焦的多模态大语言模型零样本学习研究,其创新性与突破性愈发凸显。Composition Zero-Shot Learning(组合零样本学习)旨在通过已有组合学习,识别全新的属性与对象组合。然而,过往研究存在诸多难题:背景干扰导致属性与对象难以有效分离;现有词嵌入无法捕捉复杂多模态语义信息;模型对已知组合过度自信,影响对新组合的泛化能力。针对这些挑战,研究团队提出了基于MLLM嵌入和属性平滑引导解缠的创新框架(TRIDENT)。通过特征自适应聚合(FAA)模块减轻背景影响,利用可学习条件掩码捕捉多粒度特征,实现更精准的解缠;采用MLLM的最后隐藏状态作为词嵌入,提升语义表达能力;利用大语言模型生成辅助属性,进行属性平滑,降低模型对已知组合的过度自信,增强对新组合的识别能力。该研究成果在多个挑战性数据集上展现出卓越性能,达到了当前的最优水平,为图像识别、智能推荐、内容理解等多个领域带来了全新解决方案。

在金融科技领域,该研究具有巨大的应用潜力。在智能风控方面,能助力更精准地识别复杂风险特征组合。例如,传统风控模型在面对新型欺诈手段时往往存在滞后性,而基于TRIDENT框架的技术可以通过分析交易行为、设备信息、用户画像等多模态数据,及时发现以往未出现过的异常风险模式,大大提升风险评估的准确性与效率,有效降低金融欺诈带来的损失。在智能客服场景中,能够更好地理解用户复杂语义组合。当用户咨询涉及多种金融产品组合或复杂业务流程的问题时,模型可以借助其强大的多模态语义理解能力,快速准确地给出解答,提供更智能、个性化的服务,显著提升用户体验与满意度。

奇富科技首席算法科学家费浩峻表示:此次成果是奇富科技科研实力的有力彰显,契合公司深耕金融科技、推动创新应用的战略布局。奇富科技一直强调让数据理解更有温度,用户认知更智能,技术迭代推动业务升级。论文中的创新技术,将助力公司在智能风控、智能客服等场景,精准洞察用户需求,实现更人性化、高效的金融服务。未来,公司会继续以技术创新为驱动,深挖金融大模型潜力,为行业智能化转型注入源源不断的动力,推动金融科技迈向新高度。

1

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OEnhRIDp407YI3Om3U4tN3YQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券