BBuf

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

LV0

发表了文章 2天前2024-05-21 15:20:23

NEON做色域变化_ 用单核性能无限逼近八核并行OpenCV

最近开始接触neon汇编，觉得这个东西在一些应用场景上好用，遂做些记录，分享下自己做的一些工作。

BBuf 2天前2024-05-21 15:20:23

性能、opencv、测试、内存、数据

发表了文章 2天前2024-05-21 15:18:58

flash-linear-attention的fused_recurrent_rwkv6 Triton实现精读

继续补在GPU上加速RWKV6模型的Linear Attention计算没有写完的内容，对flash-linear-attention库（https://g...

BBuf 2天前2024-05-21 15:18:59

torch、函数、flash、mask、state

发表了文章 10天前2024-05-13 11:16:48

AffineQuant: 大语言模型的仿射变换量化

本文研究了大型语言模型（LLMs）在移动和边缘设备上的推理加速问题，这一问题在现实应用中具有重要意义。随着大型语言模型在多种任务中展现出卓越的性能，它们吸引了越...

BBuf 10天前2024-05-13 11:16:48

效率、性能、优化、量化、模型

发表了文章 10天前2024-05-13 11:16:04

单节点8xA800跑起来HuggingFace DeepSeek V2踩坑

尝试跑起来HuggingFace上release的DeepSeek V2，踩了几个坑，这里给出解决的方法。HuggingFace提供的开源DeepSeek V2...

BBuf 10天前2024-05-13 11:16:04

开源、max、model、模型、优化

发表了文章 10天前2024-05-13 11:14:58

在GPU上加速RWKV6模型的Linear Attention计算

本文主要讲一些看到的RWKV 6模型的Linear Attention模块推理加速方法，在这篇博客中暂不涉及对kernel的深入解析。首先，flash-line...

BBuf 10天前2024-05-13 11:14:58

state、模型、线程、优化、gpu

发表了文章 10天前2024-05-13 11:14:29

性能提升，星辰AI大模型TeleChat-12B评测

2月份的时候评测过TeleChat-7B大模型，见星辰AI大模型TeleChat-7B评测。最近中电信 AI 科技有限公司针对TeleChat-7B进行了性能升...

BBuf 10天前2024-05-13 11:14:29

模型、数据、性能、开源、测试

发表了文章 27天前2024-04-26 14:56:04

梳理RWKV 4，5(Eagle)，6(Finch)架构的区别以及个人理解和建议

之前我解析过RWKV-4的结构和代码实现（https://zhuanlan.zhihu.com/p/653327189），这里再把它和RWKV5，RWKV6放在...

BBuf 27天前2024-04-26 14:56:04

state、time、架构、模型、数据

发表了文章 27天前2024-04-26 14:55:28

如何用Infini-attention实现超长上下文Transformer

图 1：Infini-attention 添加了一个线性注意力的压缩记忆单元，用于处理无限长的上下文。{KV}s−1 和 {KV}s 分别是当前和之前输入段的注...

BBuf 27天前2024-04-26 14:55:28

内存、效率、压缩、存储、模型

发表了文章 27天前2024-04-26 14:54:26

CVPR2024-扩散模型可解释性新探索，图像生成一致性创新高！AI视频生成新机遇？

在本研究中，作者指出了对图像生成扩散模型的可重复性或一致性进行定量评分的重要性。本文提出了一种基于成对平均CLIP（对比语言-图像预训练）分数的语义一致性评分方...

BBuf 27天前2024-04-26 14:54:26

视频、统计、开源、量化、模型

发表了文章 2024-04-182024-04-18 19:18:22

系统调优助手，PyTorch Profiler TensorBoard 插件教程

使用PyTorch Profiler进行性能分析已经一段时间了，毕竟是PyTorch提供的原生profile工具，个人感觉做系统性能分析时感觉比Nsys更方便一...

BBuf 2024-04-182024-04-18 19:18:23

pytorch、profiler、插件、教程、系统

发表了文章 2024-04-122024-04-12 13:35:45

nndeploy - 一款开源的模型端到端部署框架

项目地址：https://github.com/DeployAI/nndeploy 欢迎star和PR

BBuf 2024-04-122024-04-12 13:35:45

框架、模型、内存、开源、部署

发表了文章 2024-04-122024-04-12 13:35:03

ICLR 2024 spotlight WURSTCHEN - 一个高效的大规模文本到图像扩散模型的架构

这篇论文探讨了一个当前在图像合成领域中的核心问题：如何在保持生成图像质量的同时，减少计算资源的消耗。目前的先进扩散模型，如Stable Diffusion和DA...

BBuf 2024-04-122024-04-12 13:35:03

压缩、架构、论文、模型、效率

发表了文章 2024-04-122024-04-12 13:34:02

《PytorchConference2023翻译系列》25 数据加载技术的演进

我叫劳伦斯·拉斯内尔，是Meta公司的工程经理，我负责PyTorch团队的一部分。在过去的两年半里，我一直专注于PyTorch库，例如Torch vision,...

BBuf 2024-04-122024-04-12 13:34:03

数据存储、系统、翻译、模型、数据

发表了文章 2024-03-272024-03-27 14:17:06

新进展！Larimar-让大型语言模型像人一样记忆与遗忘

更新大型语言模型（LLM）中的知识是当前研究的一个重要挑战。本文介绍了Larimar——一种受大脑启发的新架构，它通过分布式情节记忆来增强LLM。Larimar...

BBuf 2024-03-272024-03-27 14:17:06

事件、数据、存储、编码、模型

发表了文章 2024-03-262024-03-26 18:09:19

AI Infra论文阅读之《在LLM训练中减少激活值内存》

写了一个Megatron-LM的3D Parallel进程组可视化的Playground，界面长下面这样：

BBuf 2024-03-262024-03-26 18:09:19

论文、模型、内存、LLM、存储

发表了文章 2024-03-262024-03-26 18:08:23

ICLR2024 oral：小尺度Transformer如何Scale Up

这篇论文探讨了在放大Transformer模型时遇到的一系列训练不稳定性问题，并提出了研究和预测这些不稳定性的方法。作者指出，尽管将Transformer模型扩...

BBuf 2024-03-262024-03-26 18:08:23

性能、优化、scale、论文、模型

发表了文章 2024-03-202024-03-20 14:31:50

ICLR 2024 最新研究 DYST 技术让视频表征更精准、更智能

首先来看引言部分，概述了在视觉表示学习领域的主流研究集中于捕捉个别图像的语义和2D结构的现状，并指出本研究的重点是同时捕捉场景的3D结构和动态，这对于规划、空间...

BBuf 2024-03-202024-03-20 14:31:51

变量、对象、模型、视频、数据

发表了文章 2024-03-072024-03-07 18:05:35

3D内容创作新篇章：DREAMGAUSSIAN技术解读，已开源

本文从自动三维数字内容创建的研究背景入手，探讨了这一领域在数字游戏、广告、电影以及元宇宙等多个领域的应用前景。特别强调了图像到3D和文本到3D这两种核心技术如何...

BBuf 2024-03-072024-03-07 18:05:36

算法、优化、渲染、开源、模型

发表了文章 2024-02-292024-02-29 16:21:04

【BBuf的CUDA笔记】十四，OpenAI Triton入门笔记三 FusedAttention

继续Triton的学习，这次来到 https://triton-lang.org/main/getting-started/tutorials/06-fused...

BBuf 2024-02-292024-02-29 16:21:04

cuda、openai、笔记、入门、性能

发表了文章 2024-02-292024-02-29 16:19:27

自动驾驶建图--道路边缘生成方案探讨

对于自动驾驶来说，建图是必不可少的，目前主流厂商技术都在从HD到"无图"进行过渡筹备中，不过想要最终实现真正的"无图"还是有很长的一段路要走。对于建图来说，包含...

BBuf 2024-02-292024-02-29 16:19:27

自动驾驶、脚本、模型、数据、优化

12 3 4 5 6 7 8...36 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2019-03-26

个人成就

获得 1.7K 次赞同
文章被阅读 881.8K 次

关注了：1关注者：220