首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【AAAI 2018】多种注意力机制互补完成VQA(视觉问答),清华大学、中国香港中文大学等团队最新工作

【导读】近日,针对VQA领域中不同注意力机制(如基于自由区域的注意力和基于检测的注意力)各有利弊的现状,来自清华大学、香港中文大学和华东师范大学的学者发表论文提出一个新的VQA深度神经网络,它集成了两种注意力机制。本文提出的框架通过多模态特征相乘嵌入方案有效地融合了自由图像区域、检测框和问题表示,来共同参与问题相关的自由图像区域和检测框上的注意力计算,以实现更精确的问答。所提出的方法在两个公开的数据集COCO-QA和VQA上进行了大量的评估,并且胜过了最先进的方法。这篇文章被AAAI2018接收,代码已开源

04
领券