专栏首页arxiv.org翻译专栏基于模糊逻辑的Web语境语言结构集成,丰富概念视觉表征(multimedia)
原创

基于模糊逻辑的Web语境语言结构集成,丰富概念视觉表征(multimedia)

由于用语义描述符自动映射视觉特征的困难,最先进的框架在索引视觉内容的覆盖率和有效性方面表现出了较差的性能。这促使我们研究如何利用Web作为一个大型信息源来提取相关的上下文语言信息,以及采用双峰视文本索引技术来丰富索引概念的词汇。我们的建议是基于多媒体索引的信号/语义方法,生成视觉内容的多面概念表示。我们建议使用从视觉上下文信息中自动提取的概念来丰富这些图像表示。我们特别针对语义概念的整合,这些语义概念比最初的索引概念更具体,因为它们更准确、更精确地表示了视觉内容。同时,本文还对自动语义标注中出现的错误索引进行了修正。在实验中,给出了原型的细节,并在一个代表复杂图像场景的30个查询的web级评估中测试了所提出的技术。

原文题目:Fuzzy Logic Based Integration of Web Contextual Linguistic Structures for Enriching Conceptual Visual Representations

原文:Due to the difficulty of automatically mapping visual features with semantic descriptors, state-of-the-art frameworks have exhibited poor performance in terms of coverage and effectiveness for indexing the visual content. This prompted us to investigate the use of both the Web as a large information source from where to extract relevant contextual linguistic information and bimodal visual-textual indexing as a technique to enrich the vocabulary of index concepts. Our proposal is based on the Signal/Semantic approach for multimedia indexing which generates multi-facetted conceptual representations of the visual content. We propose to enrich these image representations with concepts automatically extracted from the visual contextual information. We specifically target the integration of semantic concepts which are more specific than the initial index concepts since they represent the visual content with greater accuracy and precision. Also, we aim to correct the faulty indexes resulting from the automatic semantic tagging. Experimentally, the details of the prototyping are given and the presented technique is tested in a Web-scale evaluation on 30 queries representing elaborate image scenes.

原文作者:M. Belkhatir

原文链接:https://arxiv.org/abs/2004.12038

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 时间约束的自适应影响最大化(Social and Information Networks)

    众所周知,影响最大化问题的目的是通过在扩散过程之前选择合适的种子用户来最大化一个信息级联在社交网络中的影响。在其自适应版本中,可以通过观察一定的扩散结果来选择额...

    用户6869393
  • 社交网络的软推荐系统(Social and Information Networks)

    最近的社交推荐系统利用朋友关系图来做出准确的推荐,因为社交网络中的朋友有着完全相同的兴趣和偏好。一些研究受益于硬聚类算法(如K-means)来确定用户之间的相似...

    用户6869393
  • 通信通道优化分区(Information Theory)

    给定一个原始的离散源X,它的分布被噪声破坏,产生的噪声数据Y与给定的联合分布p(X,Y)。然后使用量化器/分类器Q: Y→Z对数据Y进行分类/量化,得到具有概率...

    用户6869393
  • 5 Postmodel Workflow

    This chapter will cover the following recipes:这章将包含以下部分:

    到不了的都叫做远方
  • 仅用四行代码实现RNN文本生成模型

    文本生成(generating text)对机器学习和NLP初学者来说似乎很有趣的项目之一,但也是一个非常困难的项目。值得庆幸的是,网络上有各种各样的优秀资源,...

    用户3578099
  • RL09 Bayesian Network

    • Bayesian Networks are directedacyclic graphs (DAGs) withan associated set of ...

    安包
  • SAP Fiori里两种弹出对话框(popup dialog)设计

    This blogs introduces the tips how to find the location of source code where the...

    Jerry Wang
  • SAP WebClient UI页面标签的决定逻辑介绍

    In this blog we have discussed the logic how the correct UI view configuration i...

    Jerry Wang
  • 不完全免疫算法简介IMADE--AIS学习笔记5

    DrawSky
  • 如何快速定位SAP CRM订单应用(Order Application)错误消息抛出的准确位置

    In my blog Six kinds of debugging tips Fabian Geyer raised a very good point abo...

    Jerry Wang

扫码关注云+社区

领取腾讯云代金券