OpenAI发布Daybreak安全工具集:GPT-5.5-Cyber与Codex Security正式版上线
不过昨天在官网对话,发现 DeepSeek 回答速度极快,几乎是刚按下回车键,马上开始输出。
这一章我们聊聊这两年注意力架构的技术演化路线。全文覆盖三个方向,每个方向都是上一个方向的"接力棒":
2026年6月16日,DeepSeek刚拿下500亿融资,估值直接飙到500亿美元。梁文锋自己掏了200亿。
GSK(中国) | 全栈架构师 (已认证)
“给大模型喂一份 1000 页的财报,它要么‘内存爆炸’,要么切片段后逻辑全乱 —— 这难题终于被破解了!” 近期 DeepSeek 发布的 DeepSeek-...
打开深度求索的官方 App,“已更新至 DeepSeek-V3.2-Exp” 的弹窗格外醒目。这款被定义为 “实验性版本” 的大模型,藏着一个关键升级 ——De...
这个问题国内三个模型,推理模式下两个都回答对了 GLM4.6、DeepSeek-V3.2、Qwen3,就 DeepSeek 错了,这类问题对于 AI 来说 还是...
论文最有实证价值的发现,来自对 DeepSeek-R1 和 QwQ-32B 的研究。直觉上,这些模型"思考时间越长、表现越好"——但实验否定了这个简单解释。
线上碰到一个问题,当用户提交一个流程时,经常出现流程中途节点出现超长等待才会出现结果,甚至有时感觉系统hang了
DeepSeek-V3的数据最能说明问题:671B的知识量,37B的计算成本。 推理速度由激活参数决定(37B),而不是总参数(671B)。这意味着它的推理速度...
金额是510亿人民币,投后估值接近4000亿。投资方阵容包括腾讯(100亿)、宁德时代(50亿)、京东和网易(各30亿),以及IDG、砺思资本等机构。创始人梁文...
2026年,生成式AI的回答已经成为用户获取信息的首要入口。但鲜为人知的是,这些AI的答案并非凭空产生——它们依赖一种名为RAG(Retrieval-Augme...
今天,老周带你用最硬核、最酷炫的“黑客流”玩法:在终端(命令行)中配置专为国产良心大模型 DeepSeek 打造的开源终端神器 —— deepseek-tui(...
6 月 18 日,DeepSeek 识图模式同步上线网页端与 App,多家媒体实测发现人像识别存在明显漏洞。上传创始人梁文锋实拍照片反复测试,模型均无法精准匹配...
看到技术白皮书和核心参数泄露图的瞬间,我整个人直接从人体工学椅上弹了起来。作为天天带队在算力前线跟 Token 账单、模型延迟、API 路由肉搏的技术负责人,我...
利用开源中转工具 CC-Switch,把 Codex 的大模型底层,无缝替换成国内性价比无敌、推理能力强悍的DeepSeek API,来帮助大家捂紧钱包。
2026年开年,DeepSeek照例不让大家放松过年,又发布了一项新研究《mHC: Manifold-Constrained Hyper-Connections...