首页
学习
活动
专区
工具
TVP
发布

专栏作者
47
文章
45507
阅读量
11
订阅数
将RAG与CoT结合起来的技术,RAT减轻长文本生成出现的幻觉问题
在过去的经验中,我们知道,CoT(思维链)模式可以降低大模型幻觉。简单讲,CoT就是让大模型按照步骤循序渐进(think step by step)地进行推理,而非直接一次给出答案,这种方式能让大模型在给出答案中将长链演算推理,变成具有规划性质的逐步迭代推导,因此,在一些逻辑推理性强的场景下能明显提升其效果。
否子戈
2024-05-03
1570
干货!构建监控日志分析和预警Agent的一种思路
我在2017年的时候参与当时所在公司的技术论坛,提到监控日志在人工智能的加持下,可实现更及时的告警,甚至是提前预警。然而,当时对这一领域只是一种设想,真正怎么去做和落地,完全没有思路。7年过去了,即使到了今天,这一话题仍然是研发领域的重磅话题,可仍然没有公开的技术解决方案。前两天在研究模型微调时,突然来了灵感,或许这是一种思路,能够实现多年来的期许。
否子戈
2024-05-03
2190
或许,我们并不需要Chinese-LLaMA3,构建高效Agent WorkFlow来合理利用大模型
目前社区已经出现了用中文语料二次训练过的llama3项目,而且数量还不少。虽然开源社区的这种热情有利于更多人享受新模型带来的进步,但是,我心中有几个疑问,让我对这种情况持怀疑态度。
否子戈
2024-04-26
2100
基于Workflow的Agent应用设计与实战
2023年市面上出现了很多和大模型相关的产品,旧金山的Prompt AI融资了500万美元,来自新加坡的Neuronicx成为全球最知名的GPT账号服务商,国内的各类套壳网站通过广告和会员赚的盆满钵满。之后,文心一言、通义千问、智普清言等服务商迅速降低了国内的大语言模型使用门槛,字节发布了第一个面向普通用户的手机App豆包则把大模型的使用门槛进一步拉低。2024年,初创公司Cognition Labs发布了全球首款全智能AI程序员Devin,字节发布coze,大模型开发进入了新的事态,让普通非编程用户基于大模型做符合自己需求的应用成为可能。
否子戈
2024-04-26
2750
Agent应用形态的3阶段,我们尚未达到第1层,但够用
这篇文章聊一聊我对Agent应用形态的看法,以及当下Agent应用的不足,没有讲技术干货,可以用AI工具快速提炼一下观点。
否子戈
2024-04-19
1410
用ComfyUI的思路设计Agent工作流
过去几周,我一直在思考如何用自然语言来编写Agent工作流。起初我的思路是通过LLM从自然语言中提炼出可用于表达Workflow的DSL,再由DSL来驱动流程引擎。但是在实现过程中,我发现流程引擎的能力与DSL的匹配度其实很难把握,其中的根源在于DSL本身的设计,往往具有局限性。在使用了ComfyUI的工作流之后,我有了新想法,这篇文章就来聊一聊。
否子戈
2024-04-19
4610
本地CPU上运行LLM,1毛钱都不想多花
如果你和我一样,最近一直在做Agent试探,就会对第三方大模型非常纠结,随着调用次数的增加,银子也是白花花的流淌,有没有省钱的办法呢?当然有,就是在CPU上跑大模型。
否子戈
2024-04-12
1790
LLM就是框架,Agent就是应用,Workflow就是架构
很多人都在思考,LLM-based时代的应用应该怎么去开发。然而,时代的惯性会束缚我们的思维,就像iphone颠覆式出现一样,在它成为市场主流之前,我们根本想不出在手机屏幕上的软件会如此不同。这让我想到那句著名的论断,汽车出现之前,人们对交通工具的究极想象都是围绕马展开,给马带上昂贵的装备,给马车装上牛逼的助推器,而当汽车出现时,人们才恍然大悟,原来交通工具可以不需要马。AI时代的到来,新的iphone时刻,是否会改变人们使用信息技术的方式?人机的交互方式,还会永远和当下一样吗?计算机上的各种功能,将会以怎样的方式在我们的工作和生活中提供能力?本文将详细聊一聊这个话题。
否子戈
2024-04-12
1410
AI智能体工作流,突破LLM代际差异,GPT-3.5干出4.0的效果
今天一篇“吴恩达:AI智能体工作流……超过下一代基础模型”的文章刷屏,随后我去看了原文,觉得现在的媒体有点脑残夸张,用标题取胜。实际上吴的意思是通过agent workflows可以大幅提高LLMs的输出表现(performance),因此,他猜测今年构建agent工作流会是一个比基础模型建设更重要的趋势,他自己也会投入更多注意力在这件事上。由于公众号文章无法插入链接,你可以访问我的博客(点击下方阅读原文)来找到文章链接。
否子戈
2024-04-12
1410
我用AI发明一门新DSL,只用了1小时!过程详解
上面的演示图片中,我首先在左侧输入框中输入了一段有明显编程暗示的自然语言文本,在文本中使用@来调用某个Agent。当我提交这段文本后,可以获得右侧弹出层内的结果,具体内容如下:
否子戈
2024-03-27
1210
超干货!如何设计基于Agent的AI应用系统
由复旦NLP和米哈游调查完成的文献综述《The Rise and Potential of Large Language Model Based Agents: A Survey》详细阐述了LLM-based Agent的相关理论、实践模型和深度思考,知乎上有大神做了详细的解读,我下面基于此再做白话版总结。
否子戈
2024-03-26
2480
如何让前端数据请求实现奇妙的孤岛隧穿?
本文将详细介绍我所写的库fods的设计思路,以解决前端数据请求的破壁,让不同的人不同的团队不同的组件,可以在相同的数据请求中各自独立工作(孤岛效果)。
否子戈
2024-03-25
790
全球首款AI程序员!时代真的落幕了吗?
前两天,由10个人的初创公司Cognition发布了全球首款AI程序员Devin。据称,他完全掌握了10几门编程语言,可以理解人类发出的编程需求,可以独立在短时间内完成端到端的编程任务,可以表现的像一名完全独立的程序员一样完成全栈任务。一时间,该消息登上业界热搜。这使得程序员这一职业又再被推上风口浪尖,饭碗不保的担忧尤为沉重。难道,这真的标志着编程时代的落幕吗?
否子戈
2024-03-25
1430
AI+低代码+语音识别,让用户闭着眼睛开发
上篇文章中提到利用 AI 配合低代码平台,可以让用户快速搭建页面和应用。本文将会对这个问题展开聊聊,不讲概念,直接上干货。
否子戈
2024-03-13
1170
“不会再有程序员了”?AI对编程演进的颠覆
今天被李厂长的暴论刷屏了,在央视《对话》界面中,他称“以后不会存在程序员这种职业了,因为只要会说话,人人都会具备程序员的能力。”这一论断迅速在业界引起广泛影响,特别是程序员在过去几年里,属于高薪职业,虽然 996 严重,但是能在激烈的各个行业中获得“福报”,算是少数能靠近共同富裕的途径。但是,现在厂长的话,剑指这一“高薪”岗位,引发了一系列震荡。虽然暴论带来的娱乐性很强,但是我们必须反思,实际上,在过去 10 年里,我发现,这些所谓的暴论,都是“社会的真相”,例如任大炮在 16 年称“年轻人现在应该买房”,马爸爸在 19 年称“年轻人有工作是福报”,某米高管称“得屌丝者得天下”,以及厂长在 22 年称“中国用户愿意用隐私换便捷”,这些暴论,听上去都像是反社会反人类,然而当时间过去几年,现在回头想想,都会有莫名的感触。因此,我有理由相信,此次厂长的暴论在某种程度上也应该被人们听进去。
否子戈
2024-03-13
1840
大模型时代,前端必须了解一下LangChain应用开发框架
AI大模型时代已经开始显露出颠覆传统开发范式的趋势,新的应用开发模式正在逐渐显现。LangChain是一个可以用Javascript来进行开发的大模型应用开发框架,它本质上也提供了一种用大模型来进行应用开发的成熟的技术路线/框架。本期节目详细讲解了这个成熟的技术路线是怎么利用大模型来进行应用的。
否子戈
2023-12-19
1K0
2024年,前端开发者,不妨看看鸿蒙开发
2023年,前端行业哀鸿遍野,不仅就业形势严峻,而且整个行业本身也摇摇欲坠,“前端已死”的论调不绝于耳。虽然我们知道,这个行业不可能死绝,但是对于就业者而言,可能60%以上的都不会好过。对前端行业的悲观预期,让很多人开始思考新的出路。本期就来聊一聊一条新路——鸿蒙开发。
否子戈
2023-12-14
4481
如何在浏览器和nodejs中使用原生接口获得相同的hash?
在一些业务场景下,我们经常需要实现一些hash摘要来进行浏览器到服务端的验证逻辑,但是如果载入第三方库,我们又需要避免该库被攻击,而nodejs自带的crypto模块可以实现加密解密,却无法在浏览器端找到对等的实现。其实,浏览器端早就提供了 Web Crypto API,我们就可以利用浏览器原生的接口来实现摘要hash啦,这样无论是在性能上,还是安全性上,都是最优解。
否子戈
2023-09-02
2121
基于HTTP流式传输的长时响应体验提升
在我们应用开发中偶尔遇到某个请求需要后端进行大量计算的情况,这种情况下,按照传统的前后端协同方式,前端需要等待后端慢慢计算,会放一个loading效果,而长时间的loading对用户的体验并不友好,而如果后端采用异步方式,在接收到前端请求后立即返回,过一段时间完成计算后再让前端请求一次,又会让界面上的数据在这段等待时间中处于老的不正确的数据情况,因此,我们需要找到一种既可以避免异步发送数据让用户误认为结果错误,又可以避免长时响应让用户等待焦虑的方法,利用流式传输,可以将结果分片返回,从而让界面实时发生变化,又可以减少前后端多次交互带来的编码困难。
否子戈
2023-09-02
1.5K0
基于DDD的前端项目架构设计与实战
注意:本文极长,超过17000字,可能需要花30分钟以上才能阅读完,且内容要点密集,可能需要在读后花费比较多的精力和时间深入理解。
否子戈
2023-03-08
8650
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档