DeepSeek-OCR 开源有段时间了,我曾详细测试过DeepSeek 最新开源 OCR 模型,实测,也推荐过基于它的 web 端应用:一个强大的开源 OCR...
博主今天在用DeepSeek时候,突然遇到久违的"服务器繁忙,请稍后再试"!反复重试的结果都是“服务器繁忙,请稍后重试”。
就在3个小时前,DeepSeek突然在HuggingFace上传新模型DeepSeek-OCR,一个只有3B大小的文档解析新模型,该模型的目标是探索视觉文本压缩...
如果它长得像“您觉得我们的新功能好用吗?”或者“您愿意为这个服务支付多少钱?”,那么很遗憾,你正在亲手制造“数据垃圾”。
今天,DeepSeek 在 HuggingFace 上公开了其最新力作:DeepSeekMath-V2,这是一款拥有 685B 参数的数学推理模型,震撼了整个开...
在数字化转型的浪潮中,运维工作正面临着复杂度高、效率低、响应慢等挑战。以Open AI 、DeepSeek为领导者的大模型层出不穷,在此背景下,OpsPilot...
截图一张接一张地弹出来,产品经理在咆哮:“看竞品A的新版面!他们怎么把那个功能上了?这不是我们明年Q1才规划的吗?”运营总监紧接着补刀:“而且他们定价策略全改了...
就在刚刚,deepseek在官方微信群发布deep seek v3.1-terminus,并同步更新线上模型。
这是一个专门为 OCR(文字识别)微调的 6.6GB 模型,主要贡献在于首次量化 “视觉 - 文本 token 压缩比”,验证 10× 近无损压缩、20× 仍保...
显示器上密密麻麻的数据已经看了8个小时,眼睛干涩得像进了沙子。老板在下午5点发来的消息还挂在钉钉窗口:"明早9点例会要用,今晚务必搞定数据分析报告。"
在人工智能技术飞速发展的2025年,DeepSeek开发平台凭借其强大的低代码开发能力和多场景应用潜力,成为企业实现数字化转型、提升商业价值的重要工具。本文将深...
会议室里,投影仪投射着上个季度的OKR表格。O(目标)写得宏大壮阔,但KR(关键结果)那一栏却惨不忍睹:有的只完成了30%,有的干脆是空白,还有的虽然完成了,但...
今天,再向大家介绍另一个同样致力于降低 DeepSeek-OCR 使用门槛的开源项目——DeepSeek-OCR Client。
大型语言模型(LLM)在处理超长上下文时面临着巨大的计算和内存成本挑战,这严重限制了它们在文档理解、代码分析和复杂推理等关键应用中的潜力。传统的解决方案,如扩展...
MLA主要通过优化KV-cache来减少显存占用,从而提升推理性能。我们知道这个结论之前,老周带大家一起梳理一下从MHA、MQA、GQA到MLA的演变历程,并着...
从DeepSeek V3的技术报告中看到的架构图中,MoE中的门控网络对应的是DeepSeekMoE的Router模块,也可以得知DeepSeek是采用的带噪声...
你可以访问Ollama的官方网站https://ollama.com/download,选择适合你操作系统的安装包进行下载。老周这里是Mac系统,所以选择下载m...
YunADX | CTO (已认证)
按照春季的惯例,一过节日各个模型就发版本,这个十一假期也没例外,开发者CLI 工具几个模型都发布了新版本,GLM-4.5升级到了GLM-4.6、Claude S...