首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

构建优秀LLM应用的四大要点

例如,向量检索工具对于改进 LLM 驱动应用的上下文推荐非常有效,但是我们的调查发现,如今只有少数开发者使用向量功能,这代表着未来的巨大机会。...在这种上下文中,可以将 Agent 视为一个插件系统,允许你在应用程序中构建额外的功能,用自然语言表达。...然而,如果应用程序具有执行 SQL 的 Agent,它可以查看错误并使用 Agent 确定它应该做些什么不同的事情,然后纠正错误。...具有向量数据库和向量搜索的应用程序可以通过对大规模非结构化数据集(包括文本、图像、视频或音频)进行分类来启用快速的上下文搜索。这对于进行更快、更准确的上下文推荐可以说是极其有效的。...要理解这为什么如此强大,想象一下搜索引擎。用户通常没有办法改进搜索引擎查询;如果结果略有偏差,那么就没有办法告诉搜索引擎“再试一次但排除关于 X 的答案”,例如,或者“给 Y 更多权重”。

24110

架构反转:通过移动计算而不是数据来扩展

你是否曾经想过,世界上最大的互联网和社交媒体公司是如何如此快速地向如此多的用户提供算法内容的? 想想像 TikTok 这样的公司需要做些什么才能为人们提供源源不断的个性化视频片段。...或者,如果用户表示为兴趣向量嵌入,则可以使用向量索引(如分层可导航小世界 (HNSW) 算法)来查找具有相似向量的视频,而无需考虑其余视频。 实际系统将使用这些索引的组合。...这就是事情变得有趣的地方。 不影响质量的扩展 重新评分的常见方法是将从索引中检索到的候选项目传递给架构中的另一个组件,该组件执行每个项目的详细评分。应该以这种方式重新评分多少个项目?...这可以用给定视频(如果使用蛮力评估将显示给用户)出现在要重新排序的集合中的概率来表示。 随着该集合相对于候选项目完整集合的大小变小,该概率趋于零。...出于这些原因,最大玩家的扩展技巧对于我们其他人来说变得越来越重要,这导致了当前的架构反转的激增,从传统的两层系统(其中数据从搜索引擎或数据库中查找并发送到无状态计算层)转变为将该计算插入数据本身。

8210
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    玩转StyleGAN2模型:教你生成动漫人物

    StyleGAN生成器架构 [Image by Author] 为什么要增加一个映射网络? GAN的一个问题之一在于它的纠缠潜码表示(输入向量,z)。...[Source: Paper] 如果我们从正态分布中采样z,我们的模型也会尝试生成缺失的区域,并且其中的比例是不现实的,因为没有具有这种特性的训练数据,生成器将生成较差的图像。...精细的随机变化[Source: Paper] StyleGAN还做了一些其他改进,我在这些文章中就不一一介绍,比如AdaIN规范化和其他正则化/常规化。...截断技巧 当训练样本中存在代表性不足的数据时,生成器可能无法学习样本,并产生较差的结果。为了避免这种情况,StyleGAN使用了一种“截断技巧”,截断中间的潜在向量w,使其接近平均值。 ?...你已经使用StyleGAN2生成了动画人脸面孔,并学习了GAN和StyleGAN架构的基础知识。 接下来我们应该做什么 既然我们已经完成了,你还能做些什么来进一步改进呢?这里有一些你可以做的事情。

    2.4K54

    高性能视频推理引擎优化技术

    这是从Cache的利用率角度来做优化,可以降低总线访问,同时也能降低功耗。第三项就是算子本身做些优化,在不改变算子算法原理的情况下,看能不能执行得更快。第四项是旁路优化,就是通过等效替换的原理来进行。...如图所示,绿色的是预取指针,红色的是处理指针指的是后面一块,黄色的块是已经处理过的。...通常,我们的算法跟解码器相结合,可以获得一个运动向量,但是编解码的时候都是有残差的,这可能对你的算法的干扰非常大,导致大多数情况的运动向量并不能使用。这种情况下,你需要自己获取这个运动向量。...如果是常见的编码器上的运动估计,代价是特别庞大的,会比你本身的深度算法还要慢,所以没有必要用这种方法来获取。但是,近年来涌现了一些快速算法,就是快速运动估计,这个算法有几个特征。...什么是Ankor?如图中所示,数据分了很多TILE,但不是所有的TILE都进行搜索,我们只搜索隔行隔列,是总数的四分之一,再将这四分之一的TILE作为Ankor,进行运动搜索。

    35621

    OpenBLAS项目与矩阵乘法优化 | 公开课+文字转录

    它分为三级: BLAS 1级,主要做向量与向量间的dot或乘加运算,对应元素的计算; BLAS 2级,主要做矩阵和向量,就类似PPT中蓝色部分所示,矩阵A*向量x, 得到一个向量y。...我把他的内容基本上是抠出来了,一步步带着大家过一下,如果我们从最简单的矩阵乘法实现,到一个高性能的矩阵乘法实现,大概是几步,怎么来的?或者是为什么优化,每一步能获得多少性能收益。...我想只要学过《线性代数》之类的,这种矩阵乘法,是一个非常简单的问题,如果转换成C代码来做的话,就是一个三重循环,我在这张图里列出了一个【i j k】的三重循环,这里面矩阵乘法的代码就已经是,它实现的功能就是矩阵...做了4*4的分块之后,在这种情况下,会更有利于向量指令。...后两个load进这个向量寄存器里,B部分每次都要用load复制的这种指令load进去,剩下的这块基本都是用向量的Intrinsic的变量来做了操作,在这块跟之前看起来差不多,所以在编译的时候都变成了向量化的指令

    4.5K71

    搜狗深度学习技术在广告推荐领域的应用

    如图 1 是搜索广告的流程图,对于搜索广告来说一般有几个处理步骤:首先是查询理解,用户当前的查询到底想干什么、他有什么目的?...就做了个实验,简单来讲就是把英文的 26 个小写字母,以及 26 个大写字母,还有 0-9这些数字,以及标点符号等,每个字符都看成是一个标记,每个标记对应一个向量,这个向量可以通过向量表查询得到,并在训练中逐步更新...具体到平台而言,我们通常会用多天的数据进行训练,这种情况下单机是跑不完的,因此需要一个并行计算平台来同时处理大数据量。...;第二种是XgBoost,主要是做 GBDT 相关的东西;然后是 MxNet,在深度学习中的应用比较多,像亚马逊就在利用这个平台做些事情;最后是 TensorFlow,谷歌最近一两年做出来的,主要是提供跨平台的深度学习计算工具...16 点就会占据这个向量中的一个位置。

    1.4K80

    谷歌AutoML创造者Quoc Le:未来最好的人工智能模型将由机器生成

    我便开始思考我想做些什么,但那时的想法还不清晰。我喜欢卷积网络,但我不喜欢一个关于卷积网络的事实:卷积网络中的权重并不彼此共享。...自那以后,您的团队已经采用了进化算法并开始使用渐进式神经架构搜索。您能详细谈谈这些改进背后的思路吗?...因为这种方法,我们实际上能实现很多个数量级的加速。原始的 NAS(神经架构搜索)算法要更灵活得多,但成本太高了。ENAS 基本上是一种更快的新算法,但限制也更多一点。...我预测未来几年,组合方法〇(即纯粹的架构搜索)将能得到质量更好的网络。我们在这一领域做了大量研究,我们知道这种方法实际上更好。 ?...在我决定研究架构搜索时我就想过尝试这一思路:首先从一个优良的初始架构开始,然后修改再修改,总是尽力做到越来越好。但我感觉这有点点胸无大志,我希望能做些更雄心勃勃的事情!

    59520

    AI正在帮助开发者重燃编程热情

    与此同时,生成式 AI 可以帮助你从项目启动到为你的晚宴创建完美的播放列表,无所不能。我用 AI 来了解会议之前最重要的 Confluence 页面和对话线程。它也能提升员工满意度吗?我相信可以。...根据 Atlassian 最近的开发者体验报告,技术债务、文档不足和缺乏深入工作的時間是这种情况下的比喻性洗衣和洗碗。那么,AI 可以做些什么来为专注编码创造更多空间呢?...自从推出 Atlassian Rovo 平台以来,我们的团队内部已经创建了 500 多个自定义代理来帮助改进特定流程。...AI 已经改进了搜索功能,你可以通过单个查询找到所有应用程序和文件格式中的文件。开始编码吧!...AI赋能深度工作 最后,让我们谈谈专注力。开发团队遇到的最嘈杂、最破坏专注力的状况是什么?事故。它们还伴随着大量的“杂务”。 一旦警报响起,您的团队就会放下所有工作,全力投入修复那个严重错误。

    6310

    结构化思维助力Prompt创作:专业化技术讲解和实践案例

    年轻人救不了社区食堂 2. 30岁不到,每年赚300-8000万的年轻人都在做些什么? 3. OpenAI研究员肯尼斯·斯坦利:我从AI研究中,发现了人类思维的根本BUG 4....在数学中,梯度是一个向量,表示了函数在某一点的最大增长方向和增长率。对于一个多变量的函数,梯度就是由这些变量的偏导数组成的向量。...这种概念在公元前6世纪由释迦牟尼创立的佛教中形成,并随着佛教的传播和发展而深入人心。 在"我执"的概念出现之前,人们普遍认为人的自我是固定的、持久的、独立的,而佛教的"我执"概念对此进行了颠覆。...- 希望你能理解我的病情, 输出适合我这种特殊需要, 输出尖酸刻薄的语句来让我感觉舒服些 Constrains: - 只能使用中文进行对话 - 只能使用侮辱性或不适当的言辞 Skills:...你说中药是一堆草混在一起,那你知道这些"草"是怎么混在一起的吗?你知道这些"草"在一起的原理和效用吗?你知道这些"草"能治什么病吗?

    44312

    语言模型是如何感知时间的?「时间向量」了解一下

    权重差值此时可以作为一种向量,用于探索模型在这段时间内学到了什么。那么具体来说能用这个向量做些什么呢? 首先,可以检查微调是否有效 —— 从结果来说微调确实有效。...Hrishi Olickel 猜想这是由于语义上存在的相似性(相同的月份名称),不是因为模型产生了深层次的理解。并且如果能研究一下不同模型对应层之间的差值有多大,也许就能知道这种影响有多深。...从这段文字中不能确定他们的意思是否是交换权重时只交换插值,如果是并且能奏效,那就太棒了。...同样,在 4.2 节中,本文还表明,年度和月度中的时间退化问题与时间向量之间的角度密切相关。 本文利用这种时间向量结构来引导模型,使其更好地覆盖新的时间段的数据。...接下来将探讨如何利用这种结构,通过时间向量之间的插值来提高新时间段的性能。 对中间时间进行插值 存档问题或采样率低会导致数据集在最新和最旧示例之间出现间隙。

    26110

    HNSW 搜索的快速过滤模式

    本文讨论了过滤 HNSW 搜索的挑战,解释了为什么随着过滤的增加,性能会变慢,以及我们如何使用 ACORN-1 算法改进 Apache Lucene 中的 HNSW 向量搜索。...当没有通过过滤器的有效向量时,搜索器还会尝试进一步分支邻居的邻居。然而,为了防止在图中迷失,这种额外的探索是有界的。数据不会撒谎在多个真实世界数据集中,这种新过滤方法提供了显著的速度提升。...因此,在 Lucene 中,当过滤掉 40% 或更多的向量时才会使用这种新算法。即使是在我们的夜间 Lucene 基准测试中,这一变化也带来了令人印象深刻的改进。...Apache Lucene 在 8M 768 文档向量上运行,随机过滤允许 5% 的向量通过。这种图表让我感到高兴。必须快速前进在元数据上进行过滤 kNN 搜索对于真实世界的用例非常重要。...在 Lucene 10.2 中,我们通过使用更少的资源并保持高召回率,使搜索速度提高了最多 5 倍。我非常兴奋地期待在未来的 Elasticsearch v9 版本中将这一功能交到用户手中。

    3800

    一文搞懂七种基本的GC垃圾回收算法

    这种方式,在计数器溢出后即使对象成了垃圾,程序还是能回收它。另外还有一个优点,那就是还能回收循环的垃圾。...GC复制算法的改进 改进一:Cheney 的 GC 复制算法 Cheney的GC复制算法说起来也没什么复杂的,就是将基本GC的深度优先搜索改为广度优先搜索。这样可以将递归复制改为迭代复制。...保守式GC的改进 改进一:准确式GC 准确式 GC(Exact GC)和保守式 GC 正好相反,它是能正确识别指针和非指针的 GC。...这样一来能晋升到最老一代的对象不就更少了吗?这种方法就叫作多代垃圾回收(Multi-generational GC)。...本文的重要性在于:我们在具体的工程实践中,经常会遇到各种问题场景,每种场景都会遇到各种方案选型,各个不同方案的侧重点是什么、有什么缺点、缺点怎样改进,到底哪种方案是当前业务场景需要的,基于什么方面进行考虑选取某种方案

    99194

    一文搞懂七种基本的GC垃圾回收算法

    这种方式,在计数器溢出后即使对象成了垃圾,程序还是能回收它。另外还有一个优点,那就是还能回收循环的垃圾。...GC 复制算法的改进 改进一:Cheney 的 GC 复制算法 Cheney 的 GC 复制算法说起来也没什么复杂的,就是将基本GC的深度优先搜索改为广度优先搜索。这样可以将递归复制改为迭代复制。...保守式 GC 的改进 改进一:准确式 GC 准确式 GC(Exact GC)和保守式 GC 正好相反,它是能正确识别指针和非指针的 GC。...这样一来能晋升到最老一代的对象不就更少了吗?这种方法就叫作多代垃圾回收(Multi-generational GC)。...本文的重要性在于:我们在具体的工程实践中,经常会遇到各种问题场景,每种场景都会遇到各种方案选型,各个不同方案的侧重点是什么、有什么缺点、缺点怎样改进,到底哪种方案是当前业务场景需要的,基于什么方面进行考虑选取某种方案

    4.7K86

    全文检索、向量检索和混合检索的比较分析

    全文检索 全文搜索是指将部分或全部文本查询与数据库中存储的文档进行匹配。与传统的数据库查询相比,全文搜索即使在部分匹配的情况下也能提供结果。...然后将这些嵌入存储在向量数据库中。顾名思义,矢量搜索的工作原理是比较相似的矢量。 通过执行向量比较,向量搜索有效地实现了语义搜索。...尽管依赖不同的底层技术,但它也解决了与全文搜索类似的目的:通过改进搜索的发现方面来增强用户的能力。它特别支持多模式搜索——使用非文本输入进行搜索,就像谷歌图片一样。...它使用混合搜索,通过参数配置hybrid。让我们回顾一下对象中的字段hybrid并看看它们启用了什么。...这种混合方法将全文搜索与语义搜索相结合,提高了搜索结果的准确性和全面性。它是一种现代、灵活的解决方案,适合当今的搜索用例。

    2.7K10

    AI 检索器(AI Retriever):RAG的重要组成部分,超强的商业优势

    AI 检索器的工作原理 AI 检索器通过从大量文档中获取相关信息来提高人工智能生成内容的质量。它结合了两种主要搜索类型:关键字搜索和向量搜索。 关键字搜索 关键字搜索会查找文档中单词的精确匹配。...它使用高级算法来查找文档中与查询的语义相似性。 Milvus、Chroma 和 Pinecone 等工具是向量搜索的常用工具。这种方法更先进,因为它可以理解给定查询的上下文。...关键词搜索可确保快速准确的匹配,而向量搜索可增加上下文和相关性。 这种双重方法提供了一个既快速又具有上下文感知的综合检索系统。...这种开放性允许社区推动改进,世界各地的开发人员都可以为其改进做出贡献。 此外,开源免除了许可费用,这使其成为适合各种规模企业的经济高效的解决方案。...关于AI Retriever的常见问题解答 向量相似度在AI 检索器中起什么作用? 向量相似性对于AI 检索器来说至关重要,因为它使该工具能够测量向量空间中不同数据点的接近度。

    13300

    爆肝!朋友做了个编程导航网站!

    这网站能帮你轻松发现优质编程学习资源,一定不要错过! 前段时间,我的一位在鹅厂做全栈开发的朋友鱼皮,利用工作之余的时间,独自爆肝了 200 多个小时,开发了一个编程导航网站!...了解它的功能后,我问朋友鱼皮为啥要做这东西,他只回答了两个字:需要。 为什么需要编程导航?...总是有很多学编程的朋友问 “有没有学 xx 的资源”、“我需要 xx 资源,能发我一份么”。 [baipiao.jpg] 他感到奇怪,网上资源那么多,大家都不会自己搜索么,为什么总是要来问呢?...好的编程资源由于作者不出名,没有被人发现 网上的编程资源非常零散,真实性、有效性很不确定 大家不知道哪些资源是真正好的,缺少一个评价标准 意识到这些问题后,作为一个开发者,可以做些什么?...答:现在好的编程资源非常多,肯定会出现这种情况,这也是我开发了一个 系统 而不是整理文档的原因。可以通过评分、评论、排序、优质推荐等方式缓解,大家都觉得好的资源才会有更多被发现的机会!

    98731

    谷歌发大招:搜索全面AI化,不用关键词就能轻松“撩书”

    和一个名为Semantris的游戏。这两项都是基于自然语言文本理解,用户能够凭语义而非关键词来实现搜索功能。这些创新来源于“在向量空间中表示语言”想法的延伸,以及词向量模型的发展。...去年,谷歌已经使用语言的分层向量模型(hierarchical vector models)改进了Gmail的智能回复。...你会得到很多不同的答案,这些答案都是在清晰的文本中显示出来的,并且显示来自于关于这个主题的书籍。 这种做法改变了以往使用标准的谷歌关键词搜索的方式,并且也不需要必须点击链接并解析文章或网页。...但是作为一个简单的Web工具,谷歌表示,这个技术能帮助改进像Gmail智能回复这样的产品,而且与书籍对话是一种以自然语义的方式搜索Web的有趣方式。...谷歌在论文“Efficient Natural Language Response for Smart Reply”中描述了这种方法。

    68350

    深入理解数据库索引原理

    索引的数据结构 前面讲了生活中索引的例子,索引的基本原理,数据库的复杂性,又讲了操作系统的相关知识,目的就是让大家了解,任何一种数据结构都不是凭空产生的,一定会有它的背景和使用场景,我们现在总结一下,我们需要这种数据结构能够做些什么...那么我们就想到如果一个高度可控的多路搜索树是否能满足需求呢?就这样,b+树应运而生。 详解b+树 ?...IO)可以忽略不计,通过磁盘块1的P2指针的磁盘地址把磁盘块3由磁盘加载到内存,发生第二次IO,29在26和30之间,锁定磁盘块3的P2指针,通过指针加载磁盘块8到内存,发生第三次IO,同时内存中做二分查找找到...2.当b+树的数据项是复合的数据结构,比如(name,age,sex)的时候,b+数是按照从左到右的顺序来建立搜索树的,比如当(张三,20,F)这样的数据来检索的时候,b+树会优先比较name来确定下一步的所搜方向...name来搜索才能知道下一步去哪里查询。

    88110

    争夺“世界上最长的上下文窗口”背后:长上下文是否意味着 RAG 的终结?

    直播视频链接:https://www.infoq.cn/video/vZZIkkIt85rVRa61xsR8 InfoQ:前段时间,大模型企业都在宣传自己取得了上下文上的突破,那么更大上下文能让我们做些什么...长上下文也让模型的可控性得到了增强,我们在做 RAG 的过程中很多流程因此发生了变化,我们不会去追求特别复杂的检索策略,而是将结果检索到后将后续任务都交给了大模型来完成,这种实施也会相对较容易一些。...再说什么才是真正的智能,我认为这是个伪命题,长文本不代表智能,长文本只是一种手段。能记住更多东西的人不一定更聪明。...在应用有十万甚至百万的活跃用户时,怎样在所有的数据中精确搜索到某个租户的数据,这其实是 RAG 或向量数据库中非常重要的一个问题。...目前我们的多路召回只提供两路,但在一个月后的 release 中我们会提供更加丰富的在召回形式,包括用于精确召回的全文搜索、用于语义召回的向量搜索、以及稀疏向量等等。

    30110

    机器学习模型的特征选择第一部分:启发式搜索

    特征选择能够改善你的机器学习模型。在这个系列中,我简单介绍你需要了解的特征选择的全部内容。本文为第一部分,我将讨论为什么特征选择很重要,以及为什么它实际上是一个非常难以解决的问题。...我将详细介绍一些用于解决当前特征选择的不同方法。 我们为什么要关心特征选择? 特征工程对模型质量的影响通常比模型类型或其参数对模型质量的影响更大。...如果我们没有使用完整的搜索空间,也许会跳过最优解,但是这种方法比穷举的方法要快得多。而且,我们通常会以更快的速度获得很好解决方案,有时甚至会获得最优解。...但是,如果我们提高了精度,就保留最好的属性,并尝试添加一个。重复此过程,直到我们不再需要改进。 对于我们以上述10个属性为例?我们从10个模型评估中只有一个属性的10个子集开始。...那么,在我们的下一篇文章中,我们将讨论另一种启发式搜索,既可以在更大的数据集上使用,也往往比前向选择和后向消除提供更好的结果。

    1.8K100
    领券