首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

万物皆可Graph | 当信息检索遇上图神经网络

作者 | 上杉翔二 悠闲会 · 信息检索 整理 | NewBeeNLP 本篇文章继续整理 Graph in Rec&Search 这个系列的文章,以前博主整理过的系列可以见: 万物皆可...Graph | 当推荐系统遇上图神经网络 万物皆可Graph | 当推荐系统遇上图神经网络(二) 万物皆可Graph | 当推荐系统遇上图神经网络(三) 万物皆可Graph | 当推荐系统遇上图神经网络...(四) 这次更新最近SIGIR2021,博主自己刷过觉得还不错的几篇文章,分搜索和推荐两篇博文整理吧,这篇是关于检索的三篇文章。...进一步考虑查询和文档之间的交互,提出了一种显式合并文档高阶邻居信息的邻居交互方法,即采样同域内的节点,进一步丰富局部图的结构信息,可以缓解数据的稀疏性问题。...一些常见的多样性检索方法博主在过往文章有过整理了,传送门:多样性检索[5]。 一般都是使用逐个选最多样的某个item,但作者认为现有多样化的方法仍然存在的问题有: 多样性排序loss是唯一的。

1.1K30
您找到你想要的搜索结果了吗?
是的
没有找到

看点:“求赞求转发”帖子影响体验 Facebook将降级处理

看点 1 “求赞求转发”帖子影响体验 Facebook将降级处理 12月19日早间消息,Facebook很快就会对主动请求点赞、评论和转发分享的文章进行降级处理,以此进一步改善消息流(News Feed...Facebook表示,这种帖子违反该公司的真实性原则,所以,他们从本周开始将会在用户的News Feed信息流中对这类内容进行降级处理。...该公司在声明中说:“我们希望降低垃圾信息、耸人听闻和误导性内容的传播范围,从而在Facebook上促进真实而有意义的对话。”...今年是Facebook第九次对外公布《透明度报告》,其中显示,政府对用户信息的要求比2016年下半年增加了21%,也就是说,从64279条增加到78890条。...总体数据显示,从今年一月到六月,Facebook收到了约377400宗投诉,其中涉及多个帖子,其中约60%与Facebook上涉嫌侵犯版权的内容相关。

945100

Facebook上看到这样的帖子,你还敢点开吗?

威胁行为者通过盗取的账户发布“我真不敢相信他已经走了,我会非常想念他”的言论,引诱用户进入一个窃取Facebook登录信息的网站,这就意味着,只要你点进该网站,你的登录信息就泄露了。...不过,当新的帖子发布并且被举报后,Facebook会停用帖子中的Facebook.com重定向链接,使它们不再起作用。...该网站会要求用户输入他们的Facebook登录信息以确认身份,才能观看视频。...Facebook钓鱼页面 来源:BleepingComputer 一旦你输入Facebook登录信息,威胁行为者就会盗取这些信息,并且该网站还会将你重定向到Google搜索页面。...目前还不清楚这些被盗取的登录信息会用来做什么,但威胁者会很可能会使用它们进一步通过被入侵的账户传播同样的钓鱼帖子

10310

利用graph.facebook.com中的反射型XSS实现Facebook账户劫持

本文分享的是graph.facebook.com中存在的反射型XSS漏洞,攻击者利用该漏洞可以构造恶意链接引诱受害者访问,添加账户绑定邮箱或手机号,从而实现对受害者Facebook账户的劫持。...漏洞情况 该漏洞只在IE和Edge浏览器中有效,漏洞原因在于graph.facebook.com中的某些API端点,在处理HTML代码响应时未实施完善安全的转义措施。...漏洞复现 1、首先,我们发送以下上传方式的POST请求: POST /app/uploads Host: graph.facebook.com access_token=ACCESS_TOKEN&file_length...sig=ARaCDqLfwoeI8V3s 所以,用该编码串之后就会有如下请求,用它可以向Facebook发起POST请求: https://graph.facebook.com/upload:MTphdHRhY2htZW50OjZiZnNjNmYxLTljY2MtNDQxNi05YzM1LTFlc2YyMmI5OGlmYz9maWxlX2xlbmd0aD0wJmZpbGVfdHlwZT08aHRtbD48Y...由此,利用以上请求串,我向其中加入我在第1步中生成的有效access_token,构造了一个HTML网页放到了我的网站中: <form action=”https://graph.facebook.com

76520

Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。...这些视频将向你展示如何做基本的分析,例如: 从Facebook下载数据 从json转换为更方便的数据结构 处理Graph API中的日期变量和其他数据 第1课:介绍和了解Graph API 在本视频中,...我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。...第4课:评论最多的帖子 在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。...https://v.qq.com/x/page/s06098fb92o.html 第5课:点赞最多帖子 在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子

1.2K20

改进 Elastic Stack 中的信息检索:混合检索

Elasticsearch ®还具有强大的词汇检索功能和丰富的工具来组合不同查询的结果。在本博客中,我们介绍了混合检索的概念,并探讨了 Elasticsearch 中可用的两种具体实现。...混合检索尽管现代训练管道产生了在零样本场景中具有良好性能的检索器模型,但众所周知,词汇检索器(例如 BM25)和语义检索器(例如 Elastic Learned Sparse Encoder)在某种程度上是互补的...具体来说,如果假设检索到的相关文档之间比检索到的不相关文档之间出现更多匹配,那么结合检索方法的结果将提高相关性。...它应用于每种方法检索到的前 N ​​个文档集。如果任一方法的该集中缺少文档,则该项设置为零。介绍倒数排名融合的论文建议 k 值为 60,并且没有讨论要检索多少个文档 N。...BM25 检索通常比语义检索更快,这一事实缓解了这一问题。我们的研究结果表明,倒数排名融合可以安全地用作有效的“即插即用”策略。

1.8K31

信息检索与文本挖掘

当涉及到自然语言处理(NLP)中的信息检索与文本挖掘时,我们进入了一个旨在从大量文本数据中发现有价值信息的领域。信息检索涉及从文本数据中检索相关信息,而文本挖掘则旨在自动发现文本中的模式、趋势和知识。...什么是信息检索与文本挖掘?信息检索是一项用于从大量文本数据中检索相关信息的任务。这通常涉及用户提供查询,系统然后在文本数据中查找与查询相关的文档或记录。...信息检索与文本挖掘在现代信息社会中具有关键意义,原因如下:大规模文本数据:我们生活在一个信息爆炸的时代,大量的文本数据每天产生。信息检索与文本挖掘可以帮助我们从这些海量数据中找到所需的信息和见解。...应用领域信息检索与文本挖掘在各种领域都有广泛的应用,包括但不限于:互联网搜索:搜索引擎如Google和百度使用信息检索技术来帮助用户找到网络上的相关信息。...社交媒体分析:分析社交媒体上的帖子、评论和消息,以了解用户的情感、趋势和观点。金融领域:分析新闻报道和市场数据,以支持金融决策和投资策略。

725140

Graph RAG: 知识图谱结合 LLM 的检索增强

Graph RAG在第一篇关于上下文学习的博客中我们介绍过,RAG(Retrieval Argumented Generation)这种基于特定任务/问题的文档检索范式中,我们通常先收集必要的上下文,然后利用具有认知能力的机器学习模型进行上下文学习...基于乔布斯自传这本书进行问答,而这个问题涉及到的上下文分布在自传这本书的 30 页(分块)的时候,传统的“分割数据,Embedding 再向量搜索”方法在多个文档块里用 TOP-K 去搜索的方法很难得到这种分散,细粒的完整信息...而且,这种方法还很容易遗漏互相关联的文档块,从而导致信息检索不完整。...用 NebulaGraph 实现 Graph RAG一个简单的 Graph RAG 可以如下去简单实现:使用 LLM(或其他)模型从问题中提取关键实体根据这些实体检索子图,深入到一定的深度(例如,2)利用获得的上下文利用...比较 Text2Cypher 和 (Sub)Graph RAG这两种方法主要在其检索机制上有所不同。

1.3K31

由于软件漏洞 1400 万 Facebook 用户的私密帖子被公开

本周四,Facebook向约1400万用户发出通知,称发现了一个软件漏洞,导致用户发表的认为只有朋友可见的私密帖子实际上所有人都看得到。...一般来说,一个Facebook用户发布的帖子都是预先设置好可见范围的,并不是所有用户都能看到。然而,今年5月18日到5月27日间出现的一个软件漏洞导致这些用户发布的帖子都默认对所有用户可见。...Facebook表示已经对受影响的帖子进行了修复,即把可见范围从“公开”变回用户的默认可见设置。目前为止,该项修复工作已经完成了。...Facebook首席隐私官艾琳·伊根(Erin Egan)在一份声明中说:“从今天开始我们向所有受影响的用户发送通知,要求他们再次查看在受影响期间发布的帖子的可见范围是否都改回了自己预先设置的。”...对于导致该问题的原因,Facebook解释称是因为一个允许用户在其个人信息,如发表的图片上添加标签的功能。

33440

学界 | 微软论文概述神经信息检索技术:如何将神经网络用于信息检索

论文的目的在于为神经模型与信息检索之间架起桥梁,互通有无,加快神经信息检索技术的发展。机器之心对该论文进行了编译,论文链接见文末。...我们以信息检索基本概念介绍和学习文本向量表征的不同神经、非神经进路开始。然后,我们回顾一下使用预训练的没有端到端学习信息检索任务的神经项嵌入(term embedding)的浅层神经信息检索方法。...最后,我们会回顾目前用于信息检索的 DNN 模型,并以讨论的形式对神经信息检索未来可能的发展方向进行总结。 ?...神经信息检索指的是将浅层或深层神经网络应用于这些检索任务之上。该教程目的在于介绍神经模型,其回应查询以进行文档排序,这是一项重要的信息检索任务。...第二部分会给出一个信息检索的任务、挑战、量度和非神经模型的调查。第三部分会提供简要神经信息检索模型的概览与信息检索的不同神经方法的分类。

1.2K40

信息检索导论(译):第一章 布尔检索(1)

信息检索这个词的含义非常广。仅从钱包中取出信用卡,然后输入信用卡号也属于信息检索的范畴。然而,从学术角度来讲,信息检索定义如下: 信息检索即从大量非结构化文档集中找到满足需要的文档的过程。...信息检索正迅速取代传统的数据库搜索的方式,成为信息获取的主要方式。除此之外,信息检索技术还可以解决其他有关数据和信息的问题。所谓非结构化数据,指的是没有清晰的可被计算机理解的语义结构的数据。...信息检索技术还可以进行半结构化搜索,如寻找标题含有Java,正文中含有threading的文档。 信息检索领域还包括帮助用户浏览,过滤文档集,以及对检索结果进行再处理。...个人信息检索(personal information retrieval):近年来,个人电脑操作系统开始集成信息检索系统。...所谓信息检索需求即用户期望得知的话题,它和查询(query)不同,所谓查询是用户将自己的信息检索需求表达为计算机可理解的方式。所谓一篇文档是相关的即用户认为此文档包含其信息检索需求相关的信息

47520

隐私保护之隐私信息检索

那么,如何在用户进行信息检索时保护用户的隐私呢?这或许会涉及到一种名为隐私信息检索的技术。 什么是隐私信息检索?...隐私信息检索是一种加密协议,旨在保障数据使用者的私隐,允许客户端从公共数据库中检索记录,同时向数据所有者隐藏检索记录的身份。实际上,检索数据而不向数据所有者透露其身份的可能性几乎为零。...隐私信息检索方案提供了有效的随机存取检索和高噪声恢复能力,允许通过只查看少量随机选择的码字比特就可以对任意比特的信息进行可靠的重建。...隐私信息检索方案的主要参数是通信复杂度,或者说是 度量用户和服务器之间通信的总比特数的函数。目前最有效的双服务器隐私信息检索协议的通信复杂度为 O (n的1/3次方)。...现代的隐私信息检索 现代的隐私信息检索方案不再基于多项式,其关键技术要素是一个具有限制交集的大集合族的设计。设 k 是一个小整数,它将 n 位消息编码成码字。

19230

改进 Elastic Stack 中的信息检索:对段落检索进行基准测试

图片在之前的博客文章中,我们讨论了信息检索的常见方法,并介绍了模型和训练阶段的概念。在这里,我们将介绍基准测试,以公平的方式比较各种方法。...BEIR 论文(“ BEIR:信息检索模型零样本评估的异构基准”,Takhur 等人,2021 年)提出了解决在通用环境中评估信息检索方法的问题。...例如,重新排序任务之前的初步检索可能会考虑前 1000 个检索到的文档,而单阶段检索可能会使用较小的列表大小来模仿用户的搜索引擎行为。我们选择将列表大小固定为前 10 个文档,这与我们的用例一致。...最后,随着时间的推移,数据库中主题或语义结构的变化将降低微调模型的检索准确性。结论我们使用 13 个数据集建立了信息检索的基础。...在我们的下一篇博客中,我们将讨论不需要创建标记数据集的高效检索系统的替代方法。这些解决方案将基于混合检索方法。

1.2K31
领券