腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器之心
专栏成员
举报
9145
文章
6884778
阅读量
281
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
模型(999+)
深度学习(999+)
神经网络(999+)
机器学习(999+)
https(999+)
数据(999+)
其他(999+)
网络安全(999+)
编程算法(963)
论文(709)
开源(633)
NLP 服务(538)
性能(419)
机器人(417)
系统(352)
视频(326)
强化学习(321)
图像处理(307)
工作(304)
算法(300)
python(281)
github(259)
测试(233)
自动驾驶(228)
游戏(224)
设计(222)
网络(219)
gpt(218)
框架(210)
优化(207)
安全(202)
科技(194)
架构(190)
硬件开发(187)
chatgpt(181)
pytorch(177)
tensorflow(174)
产品(154)
监督学习(149)
工具(142)
git(140)
函数(140)
基础(138)
图像识别(133)
开发(129)
卷积神经网络(128)
开发者(126)
芯片(126)
企业(124)
数学(122)
腾讯云测试服务(120)
行业(117)
无人驾驶(116)
openai(116)
语音识别(111)
api(110)
搜索(108)
汽车(107)
分布式(96)
数据库(92)
服务(90)
内存(90)
数据分析(88)
渲染(85)
linux(84)
http(84)
大数据(82)
ide(78)
tcp/ip(78)
声纹识别(76)
网站(75)
效率(75)
存储(72)
自动化(70)
云计算(70)
学习方法(68)
编码(68)
html(66)
研发(65)
sql(64)
keras(64)
人脸识别(63)
数据结构(63)
语音(61)
迁移学习(60)
苹果(60)
计算机(59)
腾讯(57)
隐私计算(56)
手机(55)
机器翻译(54)
缓存(51)
gpu(51)
meta(51)
计算机科学(51)
无监督学习(49)
token(49)
文件存储(48)
对象(48)
LLM(48)
nat(47)
编程(47)
华为(47)
音频(47)
推荐系统(45)
解决方案(44)
工程师(43)
搜索引擎(42)
知识图谱(42)
css(41)
软件(41)
部署(40)
百度(38)
压缩(38)
java(37)
打包(37)
连接(37)
医疗(36)
windows(36)
量化(36)
javascript(35)
公众号(35)
计算机视觉(35)
硬件(35)
数据挖掘(34)
微信(34)
c++(33)
腾讯云开发者社区(33)
迁移(33)
翻译(33)
ios(32)
黑客(31)
创业(31)
arm(30)
批量计算(29)
联邦学习(29)
iphone(28)
numpy(28)
go(27)
云直播(27)
变量(27)
事件(25)
决策树(24)
数据处理(24)
教育(24)
实践(24)
程序(23)
区块链(22)
短视频(22)
nlp(22)
动画(22)
服务器(22)
物联网(21)
fpga(21)
com(21)
编程语言(21)
统计(21)
原理(21)
apache(19)
prompt(19)
插件(19)
语音合成(18)
kernel(18)
5g(18)
互联网(18)
可视化(18)
隐私(18)
程序员(17)
内核(17)
文字识别(16)
markdown(16)
aigc(16)
管理(16)
接口(16)
摄像头(16)
mac os(15)
嵌入式(15)
金融(15)
acl(15)
gan(15)
集合(15)
量子计算(15)
排序(15)
图表(15)
重构(15)
android(14)
opencv(14)
数据可视化(14)
cpu(14)
表格(14)
通信(14)
博客(13)
漏洞(13)
.net(12)
高性能计算(12)
电商(12)
数据安全(12)
爬虫(12)
架构设计(12)
app(12)
编译(12)
地图(12)
数据中心(12)
bash(11)
matlab(11)
访问管理(11)
gui(11)
agent(11)
facebook(11)
脚本(11)
原型(11)
r 语言(10)
node.js(10)
ajax(10)
容器(10)
运维(10)
面向对象编程(10)
线性回归(10)
flash(10)
code(10)
工作流(10)
技巧(10)
教程(10)
面试(10)
配置(10)
数据科学(10)
单片机(9)
容器镜像服务(9)
模式识别(9)
系统架构(9)
lstm(9)
video(9)
操作系统(9)
代理(9)
阿里巴巴(9)
高性能(9)
模块化(9)
索引(9)
协议(9)
异常(9)
元宇宙(9)
php(8)
spring(8)
正则表达式(8)
小程序(8)
腾讯云(8)
acm(8)
bug(8)
scaling(8)
编译器(8)
布局(8)
反射(8)
集群(8)
开源框架(8)
浏览器(8)
入门(8)
软件工程(8)
树莓派(8)
特效(8)
erp(7)
scikit-learn(7)
processing(7)
虚拟化(7)
jupyter notebook(7)
智能创作(7)
adobe(7)
bit(7)
image(7)
ocr(7)
vr(7)
供应链(7)
同步(7)
终端(7)
LoRa(7)
Midjourney(7)
swift(6)
c 语言(6)
json(6)
bash 指令(6)
单元测试(6)
智能客服机器人(6)
graph(6)
patch(6)
pdf(6)
客户端(6)
路由(6)
密码学(6)
日志(6)
移动端(6)
语法(6)
oracle(5)
中文分词(5)
SSL 证书(5)
人脸核身(5)
内容理解(5)
视频处理(5)
express(5)
serverless(5)
devops(5)
spark(5)
ssh(5)
unity(5)
安全漏洞(5)
视频分析(5)
cuda(5)
google(5)
max(5)
models(5)
office(5)
ps(5)
text(5)
递归(5)
后端(5)
计算机图形学(5)
进程(5)
逆向工程(5)
软件开发(5)
图形学(5)
音视频(5)
字符串(5)
脑机接口(5)
比特币(4)
xcode(4)
scala(4)
ubuntu(4)
全站加速网络(4)
DevOps 解决方案(4)
智慧物流(4)
二叉树(4)
rpc(4)
特征工程(4)
sdk(4)
rust(4)
模型测试(4)
视频理解(4)
智慧交通(4)
智能制造(4)
cto(4)
debug(4)
macbook(4)
self(4)
youtube(4)
笔记(4)
二维码(4)
加密(4)
兼容性(4)
流量(4)
拖拽(4)
解释器(4)
费用中心(3)
云服务器(3)
数据万象(3)
数字货币(3)
ruby(3)
access(3)
unix(3)
nginx(3)
apt-get(3)
mapreduce(3)
日志服务(3)
TDSQL MySQL 版(3)
NAT 网关(3)
腾讯云小微(3)
kubernetes(3)
shell(3)
dns(3)
asp(3)
cdn(3)
微服务(3)
canvas(3)
机器学习平台(3)
性能测试(3)
腾讯广告算法大赛(3)
云游戏(3)
流计算 Oceanus(3)
alpha(3)
amd(3)
cs(3)
detection(3)
epoch(3)
excel(3)
glm(3)
instance(3)
intel(3)
interpreter(3)
it(3)
jupyter(3)
keynote(3)
layer(3)
map(3)
mask(3)
mobile(3)
nvidia(3)
object(3)
overflow(3)
pipeline(3)
reddit(3)
robotics(3)
ssm(3)
uber(3)
登录(3)
二进制(3)
跨域(3)
敏捷(3)
排序算法(3)
前端(3)
全栈(3)
调试(3)
异步(3)
云服务(3)
智慧城市(3)
对象存储(2)
perl(2)
c#(2)
lua(2)
react(2)
jquery ui(2)
xml(2)
jquery(2)
qt(2)
云数据库 Redis(2)
django(2)
windows server(2)
黑石物理服务器(2)
命令行工具(2)
检测工具(2)
短信(2)
双螺旋(2)
生物基因(2)
智能交通(2)
出行(2)
智能硬件(2)
svg(2)
互联网金融(2)
html5(2)
hadoop(2)
jvm(2)
yum(2)
selenium(2)
聚类算法(2)
angel(2)
腾讯会议(2)
dart(2)
raft(2)
内容识别(2)
智能推荐平台(2)
手势识别(2)
智能音乐(2)
adapter(2)
bi(2)
block(2)
class(2)
dataset(2)
dsl(2)
e2e(2)
el(2)
embedding(2)
eval(2)
free(2)
gaussian(2)
gif(2)
ipa(2)
kaggle(2)
key(2)
knn(2)
latex(2)
local(2)
mesh(2)
midi(2)
min(2)
module(2)
na(2)
nas(2)
network(2)
next(2)
null(2)
pascal(2)
point(2)
powerpoint(2)
ram(2)
rpa(2)
salesforce(2)
set(2)
similarity(2)
size(2)
stack(2)
state(2)
system(2)
ui(2)
vi(2)
wifi(2)
word(2)
word2vec(2)
yolo(2)
zero(2)
百度飞桨(2)
编辑器(2)
边缘计算(2)
并发(2)
产品经理(2)
动态规划(2)
公有云(2)
黑客马拉松(2)
后台(2)
继承(2)
开源软件(2)
命令行(2)
设计模式(2)
视频编码(2)
数组(2)
图数据库(2)
推荐算法(2)
线程(2)
虚拟机(2)
虚拟现实(2)
用户体验(2)
游戏开发(2)
游戏引擎(2)
远程办公(2)
增强现实(2)
最佳实践(2)
自然语言处理(2)
深度学习框架(2)
向量数据库(2)
云+校园(1)
云点播(1)
云镜(主机安全)(1)
官方文档(1)
认证考试(1)
objective-c(1)
cocoa(1)
actionscript(1)
bootstrap(1)
regex(1)
vue.js(1)
typescript(1)
ecmascript(1)
opengl(1)
汇编语言(1)
composer(1)
云数据库 SQL Server(1)
postgresql(1)
flask(1)
vba(1)
jar(1)
maven(1)
全文检索(1)
云数据迁移(1)
实时音视频(1)
音视频点播加速(1)
智能鉴黄(1)
es 2(1)
专有云(1)
金融风控(1)
智慧零售(1)
工业物联(1)
electron(1)
云联网(1)
babel.js(1)
压力测试(1)
wordpress(1)
hive(1)
sql server(1)
spring boot(1)
npm(1)
seo(1)
kotlin(1)
敏捷开发(1)
socket编程(1)
uml(1)
lamp(1)
ntp(1)
anaconda(1)
sas(1)
haskell(1)
nest(1)
智能外呼机器人(1)
信息流(1)
mqtt(1)
flutter(1)
对话机器人(1)
ddos 攻击(1)
内容安全(1)
云开发(1)
分类算法(1)
接口测试(1)
测试策略(1)
etcd(1)
flink(1)
ghost(1)
媒体处理(1)
智能编辑(1)
数据脱敏(1)
验证码(1)
视频内容安全(1)
应用安全开发(1)
Elasticsearch Service(1)
数据集成(1)
图像标签(1)
图像分析(1)
测试服务(1)
数据湖(1)
自由视角(1)
设计云(1)
腾讯天籁 inside(1)
智慧停车(1)
基础教育(1)
智能家居(1)
小程序·云开发(1)
代码托管(1)
action(1)
ada(1)
alexa(1)
amp(1)
animation(1)
apollo(1)
apple(1)
assertion(1)
atomic(1)
automation(1)
aws(1)
backbone(1)
background(1)
bat(1)
cad(1)
cell(1)
chat(1)
classification(1)
composition(1)
config(1)
connect(1)
container(1)
controller(1)
cookies(1)
copy(1)
cut(1)
data(1)
database(1)
db(1)
diff(1)
difference(1)
direct3d(1)
distance(1)
distribution(1)
drawing(1)
element(1)
email(1)
embed(1)
encoding(1)
entity(1)
equation(1)
error(1)
extract(1)
factory(1)
feed(1)
figure(1)
final(1)
focus(1)
formula(1)
frame(1)
fs(1)
gin(1)
global(1)
gps(1)
gradient(1)
gzip(1)
hierarchy(1)
history(1)
hugo(1)
identifier(1)
ipad(1)
jpeg(1)
julia(1)
label(1)
lambda(1)
list(1)
lm(1)
logic(1)
ls(1)
mac(1)
match(1)
matching(1)
math(1)
matplotlib(1)
matrix(1)
mean(1)
media(1)
medium(1)
memory(1)
microsoft(1)
mips(1)
mnist(1)
modeling(1)
mvp(1)
nft(1)
nio(1)
oceanbase(1)
ode(1)
offline(1)
offset(1)
optimization(1)
output(1)
owl(1)
photo(1)
photoshop(1)
physics(1)
pixel(1)
position(1)
prediction(1)
presto(1)
project(1)
publish(1)
pyramid(1)
random(1)
reduce(1)
reference(1)
relation(1)
rest(1)
rgb(1)
rss(1)
scale(1)
sensors(1)
sh(1)
shift(1)
signature(1)
sketch(1)
slice(1)
slide(1)
smoothing(1)
space(1)
split(1)
src(1)
ssl(1)
store(1)
sum(1)
summary(1)
svm(1)
t4(1)
target(1)
time(1)
tm(1)
torch(1)
tree(1)
twitter(1)
var(1)
verification(1)
vim(1)
web(1)
web3(1)
webp(1)
wix(1)
worker(1)
workspace(1)
z3(1)
zip(1)
备份(1)
遍历(1)
表单(1)
播客(1)
产品设计(1)
队列(1)
多线程(1)
工具类(1)
规范化(1)
混合云(1)
架构师(1)
监控(1)
交换机(1)
局域网(1)
开发工具(1)
开发环境(1)
快捷键(1)
路由器(1)
乱码(1)
求职(1)
权限(1)
上传图片(1)
生命周期(1)
数据采集(1)
数据存储(1)
数据管理(1)
系统设计(1)
小游戏(1)
性能优化(1)
远程工作(1)
云平台(1)
指针(1)
重定向(1)
主机(1)
城市交通(1)
时序预测(1)
梯度下降算法(1)
量子算法(1)
混合现实(1)
深度强化学习(1)
图像分割(1)
3D建模(1)
腾讯混元大模型(1)
幻兽帕鲁(1)
搜索文章
搜索
搜索
关闭
微软颠覆生产力:Copilot推自定义版,AI PC原生支持PyTorch,奥特曼预告新模型
模型
pytorch
工作
开发
开发者
5 月 22 日凌晨,微软 Build 2024 开发者大会在美国西雅图召开,今天的发布有关 AI 技术,更有关 AI 带来的新工具。
机器之心
2024-05-22
112
0
Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升
meta
模型
芯片
性能
pytorch
Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手,目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件,特别是用于运行和训练 Meta AI 模型的芯片。
机器之心
2024-04-12
122
0
Keras 3.0正式发布:可用于TensorFlow、JAX和PyTorch
tensorflow
keras
pytorch
框架
模型
「大新闻:我们刚刚发布了 Keras 3.0 版本!」Keras 之父 François Chollet 在 X 上激动的表示。「现在你可以在 JAX、TensorFlow 以及 PyTorch 框架上运行 Keras……」
机器之心
2023-11-30
407
0
PyTorch团队重写「分割一切」模型,比原始实现快8倍
pytorch
模型
内存
内核
优化
从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI 的训练、推理等,尤其是在使用 PyTorch 的情况下。
机器之心
2023-11-22
379
0
改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键
pytorch
模型
内存
数据
性能
近日,深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 在 CVPR 2023 上发表了主题演讲「Scaling PyTorch Model Training With Minimal Code Changes」。
机器之心
2023-09-08
511
0
Keras 3.0预览版迎来重大更新:适用于TensorFlow、JAX和PyTorch
tensorflow
keras
pytorch
后端
框架
Keras 出新库了,这次是 Keras Core,我们可以将其理解为 Keras 3.0 预览版,预计今年秋天正式发布。
机器之心
2023-08-07
283
0
英伟达H100用11分钟训完GPT-3,PyTorch创始人:不要只看时间
pytorch
gpt
测试
软件
芯片
为啥呢?原来在最新的 MLPerf 基准测试中,英伟达 H100 GPU 芯片组在以下八项基准测试中全部创下了新纪录,同时成为唯一一个跑完所有测试的硬件平台。
机器之心
2023-08-07
218
0
Star量近8万,大火AutoGPT星标超PyTorch,网友:看清它的局限性
网站
pytorch
表单
工具
互联网
机器之心报道 机器之心编辑部 英伟达 AI 科学家 Jim Fan 表示,「AutoGPT 只是一项有趣的实验,虽然火爆但并不意味着可以投入生产。」他的观点得到了很多人的附和和现身说法。 仿佛一夜之间,AI 圈出现了一个新晋顶流:AutoGPT。 顾名思义,AutoGPT 为自主人工智能,一项任务交给它,它能自主地提出计划,然后执行,完全不用人类插手的那种。此外其还具有互联网访问、使用 GPT-3.5 进行文件存储和生成摘要等功能。 例如,用户让 AutoGPT 建立一个网站,提出的要求是让其创建一个表单,
机器之心
2023-04-21
339
0
纯Rust编写的机器学习框架Neuronika,速度堪比PyTorch
机器学习
pytorch
开发
科技
框架
机器之心报道 编辑:陈萍 这是一个用 Rust 编写的机器学习框架,与 PyTorch 类似,现已实现最常见的层组件(dense 层、dropout 层等),速度堪比 PyTorch。 Rust 作为一门系统编程语言,专注于安全,尤其是并发安全,支持函数式和命令式以及泛型等编程范式的多范式语言,其语法上与 C++ 类似。 随着 Rust 语言热度的强劲增长,也有许多研究者探索 Rust 在机器学习等方面的研究。近日,有研究者用 Rust 编写了一个机器学习框架 Neuronika。 Neuronika 是
机器之心
2023-03-29
888
0
PyTorch 1.9发布,支持新API,可在边缘设备中执行
api
深度学习
分布式
pytorch
模型
机器之心报道 编辑:陈萍 PyTorch 团队发布了 PyTorch 1.9 版本。该版本整合了 1.8 版本发布以来的 3,400 多次 commit,398 名贡献者参与更新。提供了包括支持科学计算、前端 API、大规模分布式训练等主要改进和新特性。 近年来,深度学习框架 PyTorch 凭借着其对初学者的友好性和灵活性,发展迅猛。不久之前,PyTorch 官方博客发布 1.8 版本,此版本由 1.7 发布以来的 3000 多个 commit 组成,重要更新内容包括在编译、代码优化和科学计算前端 API
机器之心
2023-03-29
457
0
PyTorch + NumPy这么做会降低模型准确率,这是bug还是预期功能?
numpy
pytorch
进程
模型
数据
机器之心报道 编辑:维度 近日,有用户在自己的项目中发现了一个微小的 bug,在 PyTorch 同时使用 NumPy 的随机数生成器和多进程数据加载会导致相同的扩充数据,只有专门设置 seed 才可以解决这个 bug,否则会降低模型的准确率。不过,有人认为这并不是一个 bug,而是预期功能,是「按预期工作的」。 行内人都知道,机器学习(ML)代码中的 bug 很难修复,并且它们不会造成编译错误,而是悄悄地降低准确率。这些 bug 简直防不胜防。最近,一位专注于机器学习的用户遇到了一个非常熟悉的 bug,
机器之心
2023-03-29
531
0
比PyTorch、TensorFlow更快,MindSpore开源一周年升级巨量新特性
机器学习
开源
pytorch
模型
数据
机器之心发布 机器之心编辑部 大家好,在 MindSpore 开发团队和社区开发者共同努力下,MindSpore 很多的新特性马上要与大家见面了,比如动态图分布式训练效率的大幅提升、一键模型迁移、模型鲁棒性检测、深度分子模拟及量子机器学习等,无论是在效率提升、易用性,还是创新方面,都是干货满满。下面就给大家快速预览即将到来的这些关键特性的文字描述,欢迎大家在 3 月 29 日 MindSpore 官方 B 站观看直播讲解,点击文章底部「阅读原文」可快速跳转至直播讲解。 一、效率提升 大幅提升动态图下分布式
机器之心
2023-03-29
565
0
快速可微分排序算法PyTorch包,配有自定义C ++和CUDA,性能更好
pytorch
函数
内核
排序算法
性能
机器之心报道 编辑:陈萍 有人将快速可微分排序算法打包实现,性能还不错。 谷歌去年年初在论文《Fast Differentiable Sorting and Ranking》中,重磅推出了首个具有 O(nlogn) 时间复杂度、O(n) 空间复杂度可微分排序算法,速度比现有方法快出一个数量级! 近日,有人在 GitHub 上开源了一个项目,通过软件包的形式实现了快速可微分排序和排名,上线几天,收获 300 + 星。 项目地址:https://github.com/teddykoker/torchsort
机器之心
2023-03-29
402
0
AMD的PyTorch机器学习工具,现在是一个Python包了
机器学习
开源
pytorch
工具
系统
机器之心报道 编辑:陈萍 前段时间,机器学习开源框架 PyTorch 提供了对 AMD ROCm 的支持,现在可作为 Python 软件包提供。 作为一款被学术界和工业界广泛使用的开源机器学习框架,PyTorch 近日发布了最新的 1.8 版本,1.8 版本的发布,使得 PyTorch 加入了对 AMD ROCm 的支持,可以方便用户在原生环境下运行,省去了配置 Docker 的繁琐。 现在,一个更令人兴奋的消息是,ROCm 开放软件平台上为 PyTorch 用户提供了一个新的安装选项。一个可安装的 Pyt
机器之心
2023-03-29
1.1K
0
PyTorch,你是不是想用Julia?不,我们还想要Python的生态
python
pytorch
julia
编译
性能
机器之心报道 机器之心编辑部 「我们已经从 Julia 中获得了很多灵感,但我们还是想要 Python。」 「人生苦短,我用 Python。」这是 Python 开发领域广泛流传的一句话。在过去的几年中,Python 也的确凭借其在易用性、生态等方面的优势一路高歌猛进,在很多编程语言排行榜中稳居前三。 但伴随着 Julia 等新势力的崛起,这种局面正在发生变化。在前段时间出炉的「Stack Overflow 2021 全球开发者调查报告」中,Python 受开发者喜爱程度仅排第六,而 Julia 则排在了
机器之心
2023-03-29
560
0
有bug!用Pytorch Lightning重构代码速度更慢,修复后速度倍增
深度学习
pytorch
模型
数据
重构
选自Medium 作者:Florian Ernst 机器之心编译 编辑:小舟、陈萍 用了 Lightning 训练速度反而更慢,你遇到过这种情况吗? PyTorch Lightning 是一种重构 PyTorch 代码的工具,它可以抽出代码中复杂重复的部分,使得 AI 研究可扩展并且可以快速迭代。然而近日一位名为 Florian Ernst 的博主却发现 PyTorch Lightning 存在一个 bug——让原本应该加速的训练变得更慢了。 本文作者 Florian Ernst Ernst 撰写博客详
机器之心
2023-03-29
810
0
Github1.3万星,迅猛发展的JAX对比TensorFlow、PyTorch
深度学习
pytorch
函数
框架
模型
机器之心报道 机器之心编辑部 JAX 是机器学习 (ML) 领域的新生力量,它有望使 ML 编程更加直观、结构化和简洁。 在机器学习领域,大家可能对 TensorFlow 和 PyTorch 已经耳熟能详,但除了这两个框架,一些新生力量也不容小觑,它就是谷歌推出的 JAX。很对研究者对其寄予厚望,希望它可以取代 TensorFlow 等众多机器学习框架。 JAX 最初由谷歌大脑团队的 Matt Johnson、Roy Frostig、Dougal Maclaurin 和 Chris Leary 等人发起。
机器之心
2023-03-29
2.1K
0
PyTorch 2.0正式版来了!
pytorch
后端
模型
内核
性能
机器之心报道 机器之心编辑部 在PyTorch Conference 2022上,研发团队介绍了 PyTorch 2.0,并宣布稳定版本将在今年 3 月正式发布,现在 PyTorch 2.0 正式版如期而至。 GitHub地址:https://github.com/pytorch/pytorch/releases PyTorch 2.0 延续了之前的 eager 模式,同时从根本上改进了 PyTorch 在编译器级别的运行方式。PyTorch 2.0 能为「Dynamic Shapes」和分布式运行提供更
机器之心
2023-03-29
412
0
改变几行代码,PyTorch炼丹速度狂飙、模型优化时间大减
pytorch
测试
模型
数据
优化
选自Sebastian Raschka博客 机器之心编译 机器之心编辑部 关于 PyTorch 炼丹,本文作者表示:「如果你有 8 个 GPU,整个训练过程只需要 2 分钟,实现 11.5 倍的性能加速。」 如何提升 PyTorch「炼丹」速度? 最近,知名机器学习与 AI 研究者 Sebastian Raschka 向我们展示了他的绝招。据他表示,他的方法在不影响模型准确率的情况下,仅仅通过改变几行代码,将 BERT 优化时间从 22.63 分钟缩减到 3.15 分钟,训练速度足足提升了 7 倍。 作者
机器之心
2023-03-29
1.2K
0
训练速度最高100倍提升!基于PyTorch实现的可微逻辑门网络开源
神经网络
开源
pytorch
模型
网络
选自arXiv 作者:Felix Petersen等 机器之心编译 编辑:袁铭怿 本文通过逻辑门组合学习来探索面向机器学习任务的逻辑门网络。这些网络由 AND 和 XOR 等逻辑门组成,为了实现有效训练,本文提出可微逻辑门网络,一种结合了实值逻辑和网络连续参数化松弛的架构。 随着神经网络的成功应用,各项研究和机构也一直在致力于实现快速且高效的计算,特别是在推理时。对此,各种技术应运而生,包括降低计算精度,二进制和稀疏神经网络。本文中,来自斯坦福大学、萨尔茨堡大学等机构的研究者希望训练出一种不同的、在计算机领
机器之心
2023-03-29
234
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档