deephub

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

LV1

全部文章

MambaOut：状态空间模型并不适合图像的分类任务
该论文探讨了Mamba架构（包含状态空间模型SSM）是否有必要用于视觉任务，如图像分类、目标检测和语义分割。通过实验证实了了Mamba在视觉识别任务中的效果，认...
deephub 4小时前2024-06-03 20:07:04
论文、模型、数据、性能、架构
使用FP8加速PyTorch训练的两种方法总结
在PyTorch中，FP8（8-bit 浮点数）是一个较新的数据类型，用于实现高效的神经网络训练和推理。它主要被设计来降低模型运行时的内存占用，并加快计算速度，...
deephub 4小时前2024-06-03 20:00:06
pytorch、device、torch、编译、模型
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
我们今天总结下2024年5月发表的最重要的论文，重点介绍了计算机视觉领域的最新研究和进展，包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别...
deephub 4小时前2024-06-03 19:59:33
视频处理、图像识别、计算机视觉、论文、模型
ChatGPT编程问题的错误率达52%，但仍有35%的用户偏好ChatGPT回答，还有39%的人根本没看出来
在这篇论文中，研究人员对ChatGPT在回答Stack Overflow编程问题时的表现进行了深入的分析。52%的ChatGPT回答包含错误信息，77%的Cha...
deephub 4小时前2024-06-03 19:55:04
开发、论文、chatgpt、编程、程序员
2024年5月大语言模型论文推荐：模型优化、缩放到推理、基准测试和增强性能
前一篇文章总结了关于计算机视觉方面的论文，这篇文章将要总结了2024年5月发表的一些最重要的大语言模型的论文。这些论文涵盖了塑造下一代语言模型的各种主题，从模型...
deephub 4小时前2024-06-03 19:54:58
优化、测试、论文、模型、性能
SUPRA：无须额外训练，将Transformer变为高效RNN，推理速度倍增
Transformers 已经确立了自己作为首要模型架构的地位，特别是因为它们在各种任务中的出色表现。但是Transformers 的内存密集型性质和随着词元数...
deephub 4小时前2024-06-03 19:54:42
数据、性能、优化、函数、模型
微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉
大型语言模型(llm)是在巨大的文本语料库上训练的，在那里他们获得了大量的事实知识。这些知识嵌入到它们的参数中，然后可以在需要时使用。这些模型的知识在培训结束时...
deephub 4小时前2024-06-03 19:43:29
测试、论文、模型、性能、LLM
宫斗大戏结束，OpenAI成立安全委员会加强AI伦理监管；Leike宣布加入Anthropic强化Claude 3的安全性
OpenAI宣布成立了一个新的安全与保障委员会，并启动了一款全新的旗舰级人工智能模型的开发，这一举措在人工智能领域引发了广泛关注。在技术快速进步的背景下，Ope...
deephub 4小时前2024-06-03 19:41:58
人工智能、安全、openai、行业、模型
通过强化学习策略进行特征选择
特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征，可以提高性能。
deephub 4小时前2024-06-03 19:41:53
强化学习、集合、模型、数据、算法
Mistral推出最强编程语言模型，22B的规模能大幅领先同类模型，并且支持80多种语言，但是不能商用
法国初创公司Mistral AI最近推出了一个名为Codestral的大型编程语言模型，旨在为开发人员提供强大的代码生成和辅助工具。这个模型支持超过80种编程语...
deephub 4小时前2024-06-03 19:41:37
测试、开发者、模型、编程、编程语言
长序列中Transformers的高级注意力机制总结
在处理长序列时，Transformers面临着注意力分散和噪音增加等挑战。随着序列长度的增长，每个词元必须与更多词元竞争注意力得分，这会导致注意力分数被稀释。这...
deephub 4小时前2024-06-03 19:41:31
路由、模型、数据、网络、函数
腾讯发布EMO的开源平替V-Express，可以根据单张照片生成对口型的说话视频
腾讯AI实验室与南京大学合作开发了一款前沿的头像视频生成模型V-Express，该模型能够根据单张个人照片生成高质量的说话视频。V-Express通过独特的渐进...
deephub 4小时前2024-06-03 19:37:45
腾讯、音频、express、开源、视频
YOLOv10的改进、部署和微调训练总结
YOLO模型因其在计算成本和检测性能之间的平衡而在实时目标检测中很受欢迎。前几天YOLOv10也刚刚发布了。我们这篇文章就来看看YOLOv10有哪些改进，如何部...
deephub 4小时前2024-06-03 19:37:38
部署、模型、效率、性能、优化
GPT-4o向ChatGPT全体用户免费开放,可自定义模型获得收入共享计划的佣金；推出ChatGPT教育版，优化对教育领域的支持
近期，OpenAI在其平台上推出了最新的GPT-4o版本，并且宣布将其一系列先进的功能免费开放给所有ChatGPT用户。这些功能包括自定义GPT模型、数据分析、...
deephub 4小时前2024-06-03 19:37:23
chatgpt、gpt、模型、优化、教育
通过f-string编写简洁高效的Python格式化输出代码
Python 3.6中引入的f-string是Python中最常用的特征之一，它可以让我们编写更干净、更高效和更易于维护的代码，我们今天就由浅入深来详细介绍使用...
deephub 4小时前2024-06-03 19:37:12
调试、字符串、python、string、数据
2024年5月第四周LLM重要论文总结
本文总结了2024年5月第四周发表的一些最重要的LLM论文。这些论文的主题包括模型优化和缩放到推理、基准测试和增强性能。
deephub 4小时前2024-06-03 19:35:14
数据、性能、LLM、论文、模型
整合LlamaIndex与LangChain构建高级的查询处理系统
构建大型语言模型应用程序可能会颇具挑战，尤其是当我们在不同的框架（如Langchain和LlamaIndex）之间进行选择时。LlamaIndex在智能搜索和数...
deephub 12天前2024-05-22 10:11:48
工具、搜索、系统、测试、代理
深入解析xLSTM：LSTM架构的演进及PyTorch代码实现详解
xLSTM的新闻大家可能前几天都已经看过了，原作者提出更强的xLSTM，可以将LSTM扩展到数十亿参数规模，我们今天就来将其与原始的lstm进行一个详细的对比，...
deephub 14天前2024-05-20 14:55:49
self、size、架构、pytorch、lstm
OpenAI 宫斗大戏继续，奥特曼连发2篇小作文，又牵扯出「封口协议」问题，网友也不买账
在近期发生的OpenAI内部风波中，公司首席执行官山姆·奥特曼（Sam Altman）和总裁兼联合创始人格雷格·布罗克曼（Greg Brockman）发布了两篇...
deephub 14天前2024-05-20 14:55:21
openai、管理、模型、协议、安全
DeepSparse: 通过剪枝和稀疏预训练，在不损失精度的情况下减少70%的模型大小，提升三倍速度
这篇论文提出了一种高稀疏性基础大型语言模型（LLMs）的新方法，通过有效的预训练和部署，实现了模型在保持高准确度的同时，显著提升了处理速度。
deephub 14天前2024-05-20 14:54:38
性能、部署、模型、内存、数据

12 3 4 5 6 7 8...71 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-04-20

个人成就

获得 3.2K 次赞同
文章被阅读 1.5M 次
文章获得 1 次首页推荐

关注了：1关注者：176

deephub

全部文章

MambaOut：状态空间模型并不适合图像的分类任务

使用FP8加速PyTorch训练的两种方法总结

2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题

ChatGPT编程问题的错误率达52%，但仍有35%的用户偏好ChatGPT回答，还有39%的人根本没看出来

2024年5月大语言模型论文推荐：模型优化、缩放到推理、基准测试和增强性能

SUPRA：无须额外训练，将Transformer变为高效RNN，推理速度倍增

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

宫斗大戏结束，OpenAI成立安全委员会加强AI伦理监管；Leike宣布加入Anthropic强化Claude 3的安全性

通过强化学习策略进行特征选择

Mistral推出最强编程语言模型，22B的规模能大幅领先同类模型，并且支持80多种语言，但是不能商用

长序列中Transformers的高级注意力机制总结

腾讯发布EMO的开源平替V-Express，可以根据单张照片生成对口型的说话视频

YOLOv10的改进、部署和微调训练总结

GPT-4o向ChatGPT全体用户免费开放,可自定义模型获得收入共享计划的佣金；推出ChatGPT教育版，优化对教育领域的支持

通过f-string编写简洁高效的Python格式化输出代码

2024年5月第四周LLM重要论文总结

整合LlamaIndex与LangChain构建高级的查询处理系统

深入解析xLSTM：LSTM架构的演进及PyTorch代码实现详解

OpenAI 宫斗大戏继续，奥特曼连发2篇小作文，又牵扯出「封口协议」问题，网友也不买账

DeepSparse: 通过剪枝和稀疏预训练，在不损失精度的情况下减少70%的模型大小，提升三倍速度

个人简介

个人成就

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐