1、图像简单标题生成与描述
对图像中的视觉内容进行归纳和总结,并使用合适的词汇与合理的语法结构将其重新组织并表达出来,是图像标题生成与描述的主要研究内容。...此 外, Kuznetsova 等 人(2014)提出了另一种基于随机树合成的图像描述生成方法,首先检测出待描述图像中的语义片段,然后从检索库中寻找携带类似语义的图像及其描述,并将其视觉片段和对应描述单独抽取出来...该工作启发了人们对于图像更为丰富表达的探索。 但 Yang 等人(2017) 认为,仅使用目标检测所生成的视觉区域因重叠可能导致位置不准确,且单个区域难以生成具有真正意义的描述句子。...它使用联合交叉(intersection over union, IoU)机制,将区域重叠阈值在{0. 2, 0. 3, 0. 4, 0. 5, 0. 6}上的精度平均值作为对定位准确性的衡量,同时使用...VG 数据集主要用于图像的密集描述模型验证,与图像对应的多条描述句子通常是离散的,各条句子之间缺乏联系与逻辑性。