首页
学习
活动
专区
圈层
工具
发布
首页标签DeepSeek

#DeepSeek

【教程】DeepSeek-OCR本地部署(上):CUDA 升级12.9,vLLM升级至最新稳定版

Ai学习的老章

DeepSeek-OCR 开源有段时间了,我曾详细测试过DeepSeek 最新开源 OCR 模型,实测,也推荐过基于它的 web 端应用:一个强大的开源 OCR...

14810

DeepSeek4或已在训练中了,要元旦献礼了吗?

AgenticAI

博主今天在用DeepSeek时候,突然遇到久违的"服务器繁忙,请稍后再试"!反复重试的结果都是“服务器繁忙,请稍后重试”。

4610

刚刚DeepSeek开源新模型DeepSeek-OCR

AgenticAI

就在3个小时前,DeepSeek突然在HuggingFace上传新模型DeepSeek-OCR,一个只有3B大小的文档解析新模型,该模型的目标是探索视觉文本压缩...

7510

拒绝“自嗨式”调研:这个AI指令,让你的问卷像专业咨询顾问写的一样

huizhudev

如果它长得像“您觉得我们的新功能好用吗?”或者“您愿意为这个服务支付多少钱?”,那么很遗憾,你正在亲手制造“数据垃圾”。

5710

刚刚,DeepSeekMath-V2再次震撼开源社区!这一次,它刷新了我们对数学推理 AI 的想象

猫头虎

今天,DeepSeek 在 HuggingFace 上公开了其最新力作:DeepSeekMath-V2,这是一款拥有 685B 参数的数学推理模型,震撼了整个开...

95900

嘉为蓝鲸OpsPilot 深度集成 DeepSeek 等大模型,开启智能运维新境界!

腾讯蓝鲸助手

在数字化转型的浪潮中,运维工作正面临着复杂度高、效率低、响应慢等挑战。以Open AI 、DeepSeek为领导者的大模型层出不穷,在此背景下,OpsPilot...

10310

被竞品"偷家"才反应过来?这个AI指令让你拥有市场上帝视角

huizhudev

截图一张接一张地弹出来,产品经理在咆哮:“看竞品A的新版面!他们怎么把那个功能上了?这不是我们明年Q1才规划的吗?”运营总监紧接着补刀:“而且他们定价策略全改了...

10010

刚刚!DeepSeek更新V3.1-Terminus,对标GPT-5-Codex?

AgenticAI

就在刚刚,deepseek在官方微信群发布deep seek v3.1-terminus,并同步更新线上模型。

12910

Karpathy盛赞DeepSeek-OCR“淘汰”tokenizer!实测如何用Claude Code 让新模型跑在N卡上

深度学习与Python

这是一个专门为 OCR(文字识别)微调的 6.6GB 模型,主要贡献在于首次量化 “视觉 - 文本 token 压缩比”,验证 10× 近无损压缩、20× 仍保...

11010

凌晨三点,我盯着Excel表格发呆

huizhudev

显示器上密密麻麻的数据已经看了8个小时,眼睛干涩得像进了沙子。老板在下午5点发来的消息还挂在钉钉窗口:"明早9点例会要用,今晚务必搞定数据分析报告。"

10410

DeepSeek 应用开发与商业变现实战|已完结

用户11922539

在人工智能技术飞速发展的2025年,DeepSeek开发平台凭借其强大的低代码开发能力和多场景应用潜力,成为企业实现数字化转型、提升商业价值的重要工具。本文将深...

11910

【提示词工程】告别"写在墙上的口号":如何用AI制定真正落地的OKR体系

huizhudev

会议室里,投影仪投射着上个季度的OKR表格。O(目标)写得宏大壮阔,但KR(关键结果)那一栏却惨不忍睹:有的只完成了30%,有的干脆是空白,还有的虽然完成了,但...

7200

DeepSeek-OCR桌面客户端,Windows用户优先体验

Ai学习的老章

今天,再向大家介绍另一个同样致力于降低 DeepSeek-OCR 使用门槛的开源项目——DeepSeek-OCR Client。

26710

DeepSeek之后,清华和智谱AI提出“视觉压缩”新范式

Ai学习的老章

大型语言模型(LLM)在处理超长上下文时面临着巨大的计算和内存成本挑战,这严重限制了它们在文档理解、代码分析和复杂推理等关键应用中的潜力。传统的解决方案,如扩展...

10210

DeepSeek技术架构解析:MLA多头潜在注意力

老周聊架构

MLA主要通过优化KV-cache来减少显存占用,从而提升推理性能。我们知道这个结论之前,老周带大家一起梳理一下从MHA、MQA、GQA到MLA的演变历程,并着...

16010

DeepSeek技术架构解析:MoE混合专家模型

老周聊架构

从DeepSeek V3的技术报告中看到的架构图中,MoE中的门控网络对应的是DeepSeekMoE的Router模块,也可以得知DeepSeek是采用的带噪声...

37420

本地部署DeepSeek R1大模型

老周聊架构

你可以访问Ollama的官方网站https://ollama.com/download,选择适合你操作系统的安装包进行下载。老周这里是Mac系统,所以选择下载m...

30110

GLM-4.6、Claude Sonnet 4.5和DeepSeek V3.2-Exp开发能力对比

白德鑫

YunADX | CTO (已认证)

按照春季的惯例,一过节日各个模型就发版本,这个十一假期也没例外,开发者CLI 工具几个模型都发布了新版本,GLM-4.5升级到了GLM-4.6、Claude S...

40510
领券