专栏首页我爱计算机视觉Github:视觉问答最新资源汇总

Github:视觉问答最新资源汇总

近日,52CV群友jokieleung对视觉问答技术涉及到的近几年相关论文和代码进行了总结,并放到了Github上,对于想了解、跟踪该方向的朋友,非常值得参考。

分享网址:

https://github.com/jokieleung/awesome-visual-question-answering

何为视觉问答Visual Question Answering,VQA)?

以下为引用知乎深度学习大讲堂关于此的定义介绍。

视觉问答,是一种涉及计算机视觉和自然语言处理的学习任务。

这一任务的定义如下:

A VQA system takes as input an image and a free-form, open-ended, natural-language question about the image and produces a natural-language answer as the output。

翻译为中文:一个VQA系统以一张图片和一个关于这张图片形式自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。简单来说,VQA就是给定的图片进行问答。

VQA系统需要将图片和问题作为输入,结合这两部分信息,产生一条人类语言作为输出。针对一张特定的图片,如果想要机器以自然语言来回答关于该图片的某一个特定问题,我们需要让机器对图片的内容、问题的含义和意图以及相关的常识有一定的理解。

VQA涉及到多方面的AI技术(图1):

细粒度识别(这位女士是白种人吗?)

物体识别(图中有几个香蕉?)

行为识别(这位女士在哭吗?)

和对问题所包含文本的理解(NLP)。

综上所述,VQA是一项涉及了计算机视觉(CV)和自然语言处理(NLP)两大领域的学习任务。它的主要目标就是让计算机根据输入的图片和问题输出一个符合自然语言规则且内容合理的答案。

在awesome-visual-question-answering项目中,作者精心总结了Visual Question Answering(VQA)(Image/Video Question Answering),Visual Question Generation ,Visual Dialog ,Visual Commonsense Reasoning 等相关领域的最新论文与对应代码。

作者称该工程将不断完善、持续更新,也欢迎大家提交相关资料。

再发一下网址:

https://github.com/jokieleung/awesome-visual-question-answering

本文分享自微信公众号 - 我爱计算机视觉(aicvml)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-03-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 机器学习研究者的养成指南,吴恩达建议这么读论文

    近日,一位网友在 Reddit 上发帖提问:「那些高效的机器学习研究者,都有什么样的习惯?」

    CV君
  • 类别不平衡学习:论文/代码/框架/库

    今天向大家介绍一个跟踪不平衡学习问题的Github资源仓库,文末附其中 7 篇相关综述论文下载。

    CV君
  • LFFD:轻量级人脸检测器,不止是快

    上面的gif图展示的是LFFD人脸检测算法,在Nvidia GPU上对1080P的图像可以跑到16ms左右。

    CV君
  • Pythpon 爬取中国天气网数据

    以前看别人用python写爬取数据的程序感觉特牛掰,今天在网上找到了一个例子参考了下,自己也写了一个。之后会结合微信机器人,然后每隔一段时间给自己和好友发送天气...

    用户5908113
  • Auto-Tinder-训练AI玩打火机刷卡游戏

    Auto Tinder是一个纯粹出于娱乐和教育目的而创建的概念项目。绝不能滥用它来伤害任何人或向平台发送垃圾邮件。自动绑定脚本不应与您的绑定文件一起使用,因为它...

    代码医生工作室
  • 三种方法实现CSS三栏布局

    本文会分别介绍三种CSS实现三栏布局的方法,可在浏览器中打开查看效果。

    前端林子
  • Java集合总览

    这篇文章总结了所有的Java集合(Collection)。主要介绍各个集合的特性和用途,以及在不同的集合类型之间转换的方式。 Arrays Array是Java...

    非著名程序员
  • Java集合类型详解

    这篇文章总结了所有的Java集合(Collection)。主要介绍各个集合的特性和用途,以及在不同的集合类型之间转换的方式。

    Java团长
  • 极客周刊丨Fuckqq.com事件爆出真相,Chrome遭微软商店封杀...

    一川水巷
  • 腾讯加入专利保护社区OIN 为造福全球终端用户贡献力量

    12月14日,腾讯宣布加入专利保护社区 OIN 。作为社区会员,腾讯正在兑现其对开源软件的承诺,并力求为造福全球终端用户贡献力量。 OIN 首席执行官 Kei...

    腾讯开源

扫码关注云+社区

领取腾讯云代金券