首页
学习
活动
专区
圈层
工具
发布

#LLM

Karpathy的LLM Wik结合AI大模型+Obsidian工具的简单验证

人月聊IT

今天继续聊下LLM Wiki个人AI智能知识库。在讲具体内容前,还是先总结下我的观点:即在当前AI时代个人知识管理,核心是要构建一套通过AI辅助实现从原始Raw...

600

LLM 训练提速约 25% 背后:缓存、重叠与 MoE 路由优化

七牛开发者

上图是 Unsloth 团队给出的性能提升汇总。这篇文章讨论的不是模型结构变化,而是一次训练系统优化实践:在不影响准确率的前提下,如何通过缓存 metadata...

1000

AI 周报 | 清场前夜:70亿美金涌入,中国大模型进入“决赛圈”

码农刚子

1️⃣ 中国大模型“清场前夜”:DeepSeek、月之暗面、阶跃星辰三天融资超70亿美元,国家大基金首次入场,国产AI估值体系一周内被彻底改写。

48710

CVPR 2026 | LLM × Graph论文总结(VLM,多模态大模型,问答,Graph4VLM等)

时空探索之旅

CVPR 2026将在2026年6月5日至7日于美国科罗拉多会议中心(Colorado Convention Center)举行。

13910

KDD 2026 | (7月轮)LLM × Graph论文总结【预祝大家假期愉快】

时空探索之旅

KDD 2026将在2026年8月9日至13日于韩国济州(Jeju, Korea )举行。

6910

用 Playwright 和 LLM 实现自愈测试自动化

deephub

Playwright 是一个用于 Web 自动化和端到端测试的开源框架。如果我们将他和LLM结合,就可以实现“自愈”的自动化测试,这样如果UI有了改动框架不再硬...

7410

破解自动化渗透测试效能迷局:基于百亿Token的LLM大模型实证解析

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

当前网络安全领域在探索大语言模型(LLM)驱动的自动化渗透测试(AutoPT)时,普遍面临战略层面的盲区与执行层面的瓶颈。行业内严重缺乏针对AutoPT的系统性...

21410

CodexManager – 本地LLM ApiKey管理 – 本地网关 – 无感切换Codex使用号商或者中转站 – 可代替cc-switch – 增大会话并发数

收心

CodexManager:免Docker部署 + 本地桌面端 + 服务进程的 Codex 账号池管理器,统一管理账号、用量与平台 Key,并提供本地网关能力。

36920

大模型微调实战:从 HuggingFace 下载到 QLoRA 部署,Java 程序员也能玩转 LLM

javpower

国内直接连 HuggingFace 官网下载模型,速度通常只有几百 KB/s,而且经常断线。一个 70B 模型的权重文件几百 GB,下到一半重来一次很崩溃。

17310

企业AI落地:从概率到确定的演进蓝图

小小猪排画中游

本文源于与腾讯云架构师同盟老师们的讨论。当时大家在探讨一个共同关心的话题:企业如何落地AI功能?

11810

零预算全栈:用免费LLM构建应用

用户11764306

还记得构建全栈应用需要昂贵的云服务积分、付费API密钥和工程师团队的日子吗?那种日子已经正式结束。到2026年,开发者可以仅使用免费工具(包括驱动智能的大语言模...

13710

深度学习的岔路口:LLM的智能本质与通往世界模型的未竟之路

sunnying

当前深度学习正站在一个关键的岔路口上。这一岔路不仅是技术路线的分歧,更是关乎“智能”本质的深层认识论分野。一条路径以大语言模型(Large Language M...

23020

大模型表格识别能力实测:GPT-5.5、Kimi、通义千问,Mimo,谁在“睁眼说瞎话”?

用户12446504

上上周,多模态大模型领域迎来了一次密集的「新老交替」。不仅 OpenAI 刷新了 GPT 系列,阿里 Qwen 与月之暗面 Kimi 也纷纷上线了最新的模型。

3900

干货预警!LLM、Skill、MCP、Agent核心差异速记

王中阳AI编程

MCP,全称Model Control Program,即模型控制程序,是连接LLM与Skill的中间载体,相当于“智能大脑与工具之间的连接器”。它的核心作用是...

37730
领券