暂无搜索历史
【引】你可能读过《clean architecture》一书, 也读过《clean code》,如果缺了些什么? 那可能就是 Clean API 了。本文译自“...
LLM 温度是一个参数,它控制着 LLM 预测的下一个单词的概率分布。它通过改变下一个单词被选中的可能性,为 LLM 的输出增加了一些随机性或多样性。温度可以影...
大语言模型(LLM)在生成文本时,通常是一个 token 一个 token 地进行。每当模型生成一个新的 token,它就会把这个 token 加入输入序列,作...
现在大家都在聊大模型,动不动就说什么“智能涌现”、“颠覆行业”。但说实话,真正能把大模型用好的,不是谁喊得响,而是看谁的系统设计够硬核!
【引】如果认为“善战者无赫赫之功”是错的,如果项目的风平浪静全部被归为没有难度,如果只有不断救火的人才能得到赏识,如果只有在鸡飞狗跳的环境中才能得到成长的话, ...
【引】又是一次漫长的阅读之旅,试图从工程视角看生成式人工智能,虽然没有完成从GAM到大型多模态模型 (LMM) 的架构演练,但是可以清晰地理解其脉络,在构建应用...
我们,正在进入一个开发人员将更少关注实现细节而更多关注描述意图和结果的时代。这让我想起了原来使用 Puppet 和 Ansible 的日子,但是已经达到了一个全...
当Model Context Protocol(MCP)在2024年11月首次亮相时,技术社区曾短暂为之振奋——从Copilot到Cognition再到Curs...
AI 智能体的兴起触发了AI应用协作的新领域。这些智能体不再局限于被动的聊天机器人或独立的系统,它们现在被设计用于推理、计划和协作ーー跨任务、跨域甚至跨组织。但...
中学时代非常喜欢看武侠小说,“飞雪连天射白鹿,笑书神侠倚碧鸳”自然不在话下,还看过梁羽生的《白发魔女传》与《七剑下天山》等书,当然还有古龙的《多情剑客无情剑》《...
在大模型应用中,尤其基于RAG框架的大模型应用,嵌入模型(embedding Model)是不可或缺的关键组件。这里总结了笔者在实践中关于潜入模型的10个思考,...
【引】AI Agent的实际效能高度依赖于其可集成的工具生态。当Agent无法接入关键数据源或功能接口时,其应用价值将大幅受限。这一核心挑战直接决定了Agent...
【引】收到图灵寄来的两本书《大模型应用开发极简入门》和《从零构建大模型》,重新点燃了自己深入理解大模型内部机制的热情,不能只知其然而不知其所以然,于是重温大模型...
Mesh 是一种网络技术,其核心特点是节点之间可以动态互联,通过多跳路由实现数据的高效传输。Mesh 网络中的每个节点既能发送/接收数据,也能为其他节点转发数据...
对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。有了统一的分级方式,大家...
随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。为了更便捷地构建这些...
数据曾被誉为新的石油,但这种说法正在演变。随着人工智能的兴起,算力已经成为企业推动创新和成功的关键资源。生成式人工智能所涉及到知识工作和创造性工作的领域 ,如果...
开源的LLM已经成为程序员、爱好者和希望在日常工作中使用生成式AI并保持隐私的用户的最佳选择,对于企业的私有化部署而言也是如此。这些模型提供了优秀的性能,有时在...
在软件工程领域,任何脱离实际业务需求的架构设计都是一种不负责任的行为,甚至可以称之为"技术层面的形式主义"。这种设计倾向往往表现为过度追求技术新颖性、盲目采用复...
DeepSeek-R1 并不是从零开始训练的。它从一个比较强大LLM (DeepSeek-V3-base)开始,进而成为一个推理大模型。为了做到这一点,使用了强...