首页
学习
活动
专区
圈层
工具
发布

亚信科技申请基于跨模态标记融合的多模态图片理解方法及装置专利,提高了对多模态图片的理解

国家知识产权局信息显示,亚信科技(中国)有限公司申请一项名为“基于跨模态标记融合的多模态图片理解方法及装置”的专利,公开号 CN120611154A,申请日期为 2025 年 08 月。

专利摘要显示,本公开实施例公开了一种基于跨模态标记融合的多模态图片理解方法及装置,涉及人工智能技术领域,该方法包括:获得多模态图片包括的图像和文本;将图像输入至图像编码器,得到至少一个图像特征,基于至少一个图像特征,确定第一视觉 token;以及使用文本分词器获取文本包括的第一文本 token;基于第一视觉 token和第一文本 token,得到第二视觉 token;将第二视觉 token和第一文本 token合并后输入至预设的大语言模型,对多模态图片进行理解。

天眼查资料显示,亚信科技(中国)有限公司,成立于1995年,位于北京市,是一家以从事互联网和相关服务为主的企业。企业注册资本2604.057万美元。通过天眼查大数据分析,亚信科技(中国)有限公司共对外投资了16家企业,参与招投标项目5000次,财产线索方面有商标信息534条,专利信息398条,此外企业还拥有行政许可13个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O6AGxtArTycjS6rELHMJcwew0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券