首页
学习
活动
专区
圈层
工具
发布

#压缩

量化大模型,本地部署,效果不打折

Ai学习的老章

这种方法并非对模型的所有层“一视同仁”地进行压缩。通过研究,Unsloth 发现模型中的某些张量(如 attn_k_b)对量化操作极为敏感。将这些关键层保持在较...

4210

教你一招:鸿蒙版 RN 应用,包体积直接减半

徐建国

周末我在学习的时候,发现打包出来的 HAP 包体积略大,这不仅影响下载速度,还可能拖慢安装和启动性能。于是我专门研究了一波优化方法,从原生侧到 RN 侧梳理出一...

4610

DeepSeek4或已在训练中了,要元旦献礼了吗?

AgenticAI

博主今天在用DeepSeek时候,突然遇到久违的"服务器繁忙,请稍后再试"!反复重试的结果都是“服务器繁忙,请稍后重试”。

1710

OpenAI精准狙击Gemini3,发布GPT-5-Codex-Max!这次支持Windows了!

AgenticAI

同时,此次还上线了压缩功能,会话在遇到上下文窗口时候,即可启动压缩,从而能够让agent模式一直运行几个小时!

4510

Hive数据压缩攻略:如何选择最优编解码器?Snappy、LZO、GZIP深度对比

用户6320865

在大数据技术飞速发展的2025年,Hive作为构建在Hadoop之上的核心数据仓库工具,其重要性愈发凸显。通过类SQL的HiveQL查询语言,它能够将结构化数据...

4010

Kafka Producer高级特性实战:消息压缩、幂等与事务的深度解析

用户6320865

在分布式消息系统中,Kafka Producer作为数据入口,承担着将应用程序生成的消息发布到Kafka集群的关键角色。它不仅仅是简单地将数据推送到Broker...

8510

Kafka存储引擎深度解析:日志清理策略与性能优化实战

用户6320865

Apache Kafka的存储引擎作为其高吞吐、低延迟特性的核心支撑,在2025年的3.x版本中依然基于高度优化的日志结构存储模型,并引入了更高效的资源管理和压...

8310

超越 VTM-RA!快手双向智能视频编码器BRHVC亮相NeurIPS2025

机器之心

视频编码(又称视频压缩)的核心价值在于破解海量视频数据与有限传输、存储资源之间的根本矛盾。未压缩的高清视频码率高达 1-3 Gbps,1 分钟 4K 视频占用近...

5310

宇宙尺度压缩:Scaling law的边界,柏拉图表征收敛于物质和信息交汇,解决P与NP问题,Simulation假说

深度学习与Python

超对称公司成功在 BigBang-Proton 实现跨尺度跨结构的科学多任务学习,并从这个基础出发提出将科学多任务学习扩展到极限,就是将宇宙当做一个完整整体进行...

5910

架构火花|AI时代,架构师的护城河在哪里?

TVP官方团队

腾讯 | 产品经理 (已认证)

许多架构师表达了共同的困惑。而工具使用门槛的降低让一些成员感到价值被稀释——如果AI工具付费VIP账号就能获得超越十年经验的能力,那么传统经验积累的价值何在?

10621

AI可以帮助人类寿命延长到150岁?这谁说的?

数智转型架构师

前两天在一个闭门会上,一位平时特严谨的技术大咖,PPT翻到最后一页,突然抛出一枚重磅炸弹:“在AI的加持下,人类寿命突破150岁,可能不再是科幻小说,而是我们这...

10110

CVE-2025-11001|7-Zip远程代码执行漏洞(POC)

信安百科

7-Zip(7z解压软件)是一款完全免费的压缩解压缩软件,同其他压缩软件相比它的压缩速度更快压缩率更好,不仅支持众多主流格式、支持超线程,而且还有强大的AES-...

31310

AI大模型破局:内存压缩与高速互连新战场

数据存储前沿技术

随着生成式AI的爆发,大语言模型(LLM)正以前所未有的速度重塑着技术格局。然而,在这场AI浪潮的背后,我们正面临着严峻的挑战:日益增长的模型规模对内存容量和数...

14810

《Linux进阶指令实操指南》:文件查看、时间管理、搜索压缩全覆盖(附高频案例)

用户11915063

功能:查看目标文件的内容,tac就是逆序查看 语法:cat [选项] [文件] 常用选项:

16010

DeepSeek之后,清华和智谱AI提出“视觉压缩”新范式

Ai学习的老章

大型语言模型(LLM)在处理超长上下文时面临着巨大的计算和内存成本挑战,这严重限制了它们在文档理解、代码分析和复杂推理等关键应用中的潜力。传统的解决方案,如扩展...

10010

【ChIP-seq分析】重叠peak分析:bedtools软件 intersect用法

三兔测序学社

intersect主要用于识别两个或多个BED/GFF/VCF文件之间相交的区域,找到两个或多个peaks中重叠的区域,并分析重叠与非重叠区域的特征差异,是后续...

14110

DeepSeek技术架构解析:MLA多头潜在注意力

老周聊架构

MLA主要通过优化KV-cache来减少显存占用,从而提升推理性能。我们知道这个结论之前,老周带大家一起梳理一下从MHA、MQA、GQA到MLA的演变历程,并着...

15810

bam文件转fastq的一些小tips

生信菜鸟团

samtools bam2fq(现多写作 samtools fastq)在大多数场景下 I/O 密集、计算量低,单线程即可跑满磁盘带宽,再增加线程也不会明显提速...

11910

7分钟搞定正则替换:批量清洗技术博客中的奇怪格式符号(含20个可套用Regex)

安全风信子

一句话承诺:复制即用的正则清单+流程图,帮你把技术文章里的奇怪空格、中文标点、错位代码块一次性清理干净。

14110

全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

数字生命卡兹克

传统的OCR任务其实特别纯粹,就是把那些图片上字啥的啊,变成你电脑里可以编辑可以复制粘贴数字文本。

22110
领券