首页
学习
活动
专区
圈层
工具
发布
首页标签第四期热点征文-大模型技术

#第四期热点征文-大模型技术

多语言文本嵌入模型解析:paraphrase-multilingual-MiniLM 与 all-MiniLM深度对比.123

未闻花名

在自然语言处理领域中,文本嵌入一直是把文本转换成计算机能够理解的数值向量的关键技术,也是很多上层任务的基础,通常我们会看到Text Embedding的关键词进...

300

大模型应用:基于1.5B、6B参数量联合评测:不同体量大模型意图识别差异验证.122

未闻花名

意图识别是自然语言处理里最核心、最落地的任务之一,不管是智能客服、智能助手,还是语音交互、智能设备控制,都离不开它。之前我们已经系统讲过意图识别的评估指标、基本...

4000

大模型应用:从意图识别到个性化推荐:基于语义意图识别的智能推荐系统.121

未闻花名

我们在刷电商、看视频、听音乐的时候,肯定都有过这种感觉:明明只是随口搜了一句话,平台就像懂你一样,推过来的东西刚好是你想要的。这背后不是玄学,也不是巧合,而是意...

12820

大模型应用:智能对话意图识别:基于关键词、语义向量与大模型的三重融合验证.120

未闻花名

很早我们就在做智能体相关的研发,在搭建对话系统、智能客服、虚拟助手这些 AI 应用时,最头疼、也最容易出问题的环节,就是意图识别。一开始总以为,只要听懂用户说了...

14410

大模型应用:大模型实测对比:1.8B vs 6B,本地部署的极限拉扯与真实体感.119

未闻花名

在本地部署大模型的圈子里,一直存在着一场关于显存与参数量的博弈,受限于本地PC的硬件限制,我们通常都用的是1.5B的小体量模型,现在随着硬件条件的加持,我们也尝...

13310

大模型推理强化学习算法解析:GRPO(Group Relative Policy Optimization)2026终极指南

jack.yang

当我们站在2026年5月的时间节点回望,人工智能领域在过去两年间经历了堪称地质运动般的剧变。如果说2024年是推理模型(Reasoning Model)的“寒武...

32620

大模型应用:Skill架构解析:理解大模型Skill的本质、核心组成和本地模型实践.116

未闻花名

长篇大论的理论基础既枯燥无味,又容易陷入理解困境。为了让大家真正理解Skill的本质吃透Skill,今天我们设计了一个极简、可运行、无外部依赖的基础示例,作为贯...

26430

大模型应用:负权图最短路径算法:Bellman-Ford与Floyd-Warshall结合大模型应用.115

未闻花名

在图论算法体系中,最短路径问题是最基础也最核心的研究方向之一。前一期我们讨论过的Dijkstra 算法作为经典的最短路径求解方法,在正权图场景下表现优异,但面对...

15210

详解动态注意力图谱分析:解构大模型实时认知轨迹的终极利器

jack.yang

文末有超值福利!如果你觉得本文对你有启发,请务必点赞、收藏、评论“666”并转发给你的朋友。你的每一个互动,都是对我持续创作深度内容的最大支持!关注我,获取更多...

16010

“注意力流追踪”技术如何揭示大模型推理路径的形成过程——全方位解构“思维链”在神经网络中的真实运作轨迹

jack.yang

文末有超值福利!如果你觉得本文对你有启发,请务必点赞、收藏、评论“666”并转发给你的朋友。你的每一个互动,都是对我持续创作深度内容的最大支持!关注我,获取更多...

15520

AI生成的代码会“说谎”?揭秘那些看似完美实则危险的逻辑陷阱 —— 开发者必须警惕的AI代码幻觉与防御策略

jack.yang

你是否曾面对过这样的情景?向AI编程助手提出一个需求,几秒后,一段结构清晰、注释详尽、格式完美的代码出现在你眼前。它看起来如此专业,以至于你几乎要直接将其合并到...

15820

如何利用注意力流数据优化提示词设计,引导模型走完完整推理路径,提升复杂任务的AI响应质量

jack.yang

文末有超值福利!如果你觉得本文对你有启发,请务必点赞、收藏、评论“666”并转发给你的朋友。你的每一个互动,都是对我持续创作深度内容的最大支持!关注我,获取更多...

11720

大模型应用:大模型响应缓存技术完全指南:TTL 缓存装饰器的设计与落地.112

未闻花名

现在我们做AI应用、大模型接口开发,基本都会碰到两个特别头疼的问题:一个是响应太慢,用户点一下要等好几秒,体验特别差;另一个就是调用成本太高,同样的问题反复问,...

17210

真正的护城河:在AI泛滥的时代,构建你的深度领域知识壁垒

jack.yang

文末有超值福利!如果你觉得本文对你有启发,请务必点赞、收藏、评论“666”并转发给你的朋友。你的每一个互动,都是对我持续创作深度内容的最大支持!关注我,获取更多...

21920

大模型应用:搜索的智能革命:大模型如何重塑传统搜索算法构建新一代智能检索.110

未闻花名

搜索早已不是简单敲几个关键词、翻几页链接的工具,而是我们每天工作、学习、生活里最离不开的信息入口。从最早的目录检索,到关键词匹配,再到后来的精准排序,搜索算法迭...

21510

从码农到AI指挥官:新时代程序员的晋升路线图—— 掌握3%判断力,在AI浪潮中实现职业跃迁

jack.yang

曾几何时,“码农”一词带着自嘲与骄傲,象征着用一行行代码构建数字世界的工匠精神。然而,进入2026年,这张旧地图已然失效。当AI能在几分钟内完成过去需要数小时甚...

14120

当AI包办97%的编码,你的3%判断力才是真金—— 一份面向2026及未来的程序员生存与进化指南

jack.yang

2026年5月,一个看似平常的春日。但对于全球数千万程序员而言,我们正集体站在一个历史性的分水岭上。分水岭的一侧,是过去数十年以“手艺人”身份精雕细琢每一行代码...

24620

Java源码详解:深入Java并发之AtomicReferenceArray全景式解析——无锁对象数组的通用基石与AI Agent时代的协同核心

jack.yang

在构建复杂的高并发系统时,我们常常需要一个 线程安全的对象数组,其中每个槽位可以独立地、原子地更新为指向 任意类型对象 的新引用。例如,实现一个动态可变的观察者...

7010

Java源码详解:深入Java并发之AtomicLongArray全景式解析——无锁长整型数组的高效并行与AI Agent时代的协同基石

jack.yang

在高并发、高性能的系统中,我们常常需要处理 64位长整型(long) 的原子操作,例如记录系统启动以来的纳秒级时间戳、维护一个巨大的全局计数器、或进行高精度的金...

12210

解密 DeepSeek V4:双轴稀疏 MoE + Engram 记忆 + Muon 优化器,如何打造高效万亿模型?

jack.yang

在人工智能技术迅猛发展的2026年,大语言模型(Large Language Models, LLMs)已成为推动全球科技变革的核心引擎。自2017年Trans...

28320
领券