gpu现存_linux主机发现存储_腾讯云有没有现存的域名 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Darknet

darknet是一个较为轻型的完全基于C与CUDA的开源深度学习框架，其主要特点就是容易安装，没有任何依赖项（OpenCV都可以不用），移植性非常好，支持CPU与GPU两种计算方式。

03

在终端绘制GPU显存使用曲线 - plus studio

这个东西的灵感来自于写torch的时候想实时看到loss和gpu使用情况，突然想到可以在终端实时显示，经过与ai的一番激烈讨，最终有了这个代码。

01

您找到你想要的搜索结果了吗？

是的

没有找到

PyTorch常见的坑汇总

最近刚开始用pytorch不久，陆陆续续踩了不少坑，记录一下，个人感觉应该都是一些很容易遇到的一些坑，也在此比较感谢帮我排坑的小伙伴，持续更新，也祝愿自己遇到的坑越来越少。

05

Pytorch常见的坑汇总

最近刚开始用pytorch不久，陆陆续续踩了不少坑，记录一下，个人感觉应该都是一些很容易遇到的一些坑，也在此比较感谢帮我排坑的小伙伴，持续更新，也祝愿自己遇到的坑越来越少。

04

Darknet是什么？如何在Windows和Linux下安装

首先，让我们看一下官网：https://pjreddie.com/darknet/

02

GPUImage详细解析（十一）美颜+人脸识别

前言一个群友用琨君的美颜录制和讯飞离线人脸识别SDK做了一个demo，功能是录制视频，要求有美颜，并且能识别人脸并放置贴图。但是遇到一个问题：录制过程能过进行人脸识别，也有美颜效果；但是录制

05

python查看显卡gpu信息

官网：https://pythonhosted.org/nvidia-ml-py/

03

突破百万亿参数规模，追求极致的效率和性价比：华人团队开源首个异构并行推荐系统训练框架Persia

机器之心专栏机器之心编辑部 Persia打破了前几代的推荐训练框架（同构的）设计思路，首次采用异构的设计思路，更合理地配置了CPU和GPU，实现了极致化的性价比。个性化推荐是互联网行业提升 DAU （Daily Active Users）和收入的核心技术手段。随着深度学习的广泛应用，现代的推荐系统通过神经网络变相地「记住」用户的行为习惯，从而精准预测出用户的喜好。在移动互联网普及之后，用户的行为数据呈现几何级数增加，单位时间内产生和收集的用户行为数据更是极其庞大，因此需要更大的模型来对用户的兴趣编码。更

01

最新开源LiDAR数据集LSOOD：四种常见的室外物体分类

来源：https://github.com/Tian-Yifei/LSOOD-LiDAR-Scanning-Outdoor-Object-Dataset

02

webgl未使用独立显卡报告

最近客户在使用我们的的三维可视化平台的时候，总是会出现浏览器崩溃，webgl context lost的情况。这种请一般出现在电脑配置很低的电脑上，比如没有独显，只有很小现存的集成显卡的电脑。

01

完胜BERT！谷歌NLP预训练利器：小模型也有高精度，单个GPU就能训练 | 代码开源

ELECTRA是一种新预训练方法，它能够高效地学习如何将收集来的句子进行准确分词，也就是我们通常说的token-replacement。

00

最新开源LiDAR数据集LSOOD：四种常见的室外物体分类

来源：https://github.com/Tian-Yifei/LSOOD-LiDAR-Scanning-Outdoor-Object-Dataset

01

腾讯云星星海重磅发布首款自研GPU服务器占据业界几宗“最”

星星海首款自研GPU服务器和星星海新一代自研双路服务器，后者也是国内首款搭载即将发布的第三代英特尔至强可扩展处理器（Ice Lake）的双路服务器。

04

抖机灵的VR解决方案|实现3D追踪、提高刷新率、保证图像渲染质量

这些方案，一定程度上能帮助解决VR体验现存的帧率不足、刷新率与图像分辨率不够高、成本昂贵、设备不够便捷等问题。

02

硬件笔记之GP106-90 3GB GTX1060 3GB魔改

最近比特币又破万了，狂潮有来了；各个显卡坐地起价，价格上扬30%的大批，再加上暑期，这价格估计一时半会下不来了；

02

Linux安装Docker并配置Docker镜像加速，daemon.json完整配置详解

修改配置文件/etc/docker/daemon.json，进入/etc/docker目录。查看是否有daemon.json文件，没有则执行如下命令创建。

03

ChatGPT模型参数≠1750亿，有人用反证法进行了证明

选自 orenleung.super.site 作者：Oren 机器之心编译编辑：rome rome OpenAI 推出的 ChatGPT 到底是不是 1750 亿参数的等价大模型呢？这篇文章或许能带给你答案。 ChatGPT 的火热持续到了今天，围绕它的爆点新闻和技术解读不断涌现。关于其参数量，有一种普遍的假设认为，ChatGPT 的参数量与 GPT-3 论文中介绍的 1750 亿参数模型相同。但是，深耕于大语言模型领域工作的人很清楚这不是真的。通过对 A100 GPU 的内存带宽分析，就会发现 Cha

05

轻量版ChatGPT训练方法开源！仅用3天围绕LLaMA打造，号称训练速度比OpenAI快15倍

萧箫发自凹非寺量子位 | 公众号 QbitAI 基于Meta模型打造的轻量版ChatGPT，这就来啦？ Meta宣布推出LLaMA才三天，业界就出现了把它打造成ChatGPT的开源训练方法，号称比ChatGPT训练速度最高快15倍。 LLaMA是Meta推出的超快超小型GPT-3，参数量只有后者的10%，只需要单张GPU就能运行。把它变成ChatGPT的方法名叫ChatLLaMA，基于RLHF（基于人类反馈的强化学习）进行训练，在网上很快掀起了一阵热度。所以，Meta的开源版ChatGPT真的要

06

这届存储，为大模型而生！

据测算，数据存储约占大模型训练整体工程量的20-30%。随着更多AIGC的产生，这个比例还在继续提升。

01

学界 | 结合堆叠与深度转换的新型神经翻译架构：爱丁堡大学提出BiDeep RNN

选自arXiv 作者：Antonio Valerio Miceli Barone等机器之心编译参与：Nurhachu Null、李泽南在神经机器翻译问题中，不同的堆叠架构已经多次在不同研究中展现出了良好的表现，而深度转换架构（Deep transition architecture）则成功地用于语言建模等用途中。爱丁堡大学与 Charles University 的研究者们对这两种架构的多个组合形式在 WMT 翻译任务中的表现进行了测试，并提出了结合堆叠与深度转换的新型神经网络：BiDeep RNN。

04

手机实时人工智能之「三维动作识别」:每帧只需9ms

本文提出了一种用于三维卷积神经网络（3D CNN）的模型压缩和移动加速框架 RT3D，通过结合神经网络权重剪枝和编译器代码优化技术，使模型的端到端运行时间与目前支持 3D CNN 的移动框架相比速度提升高达 29.1 倍，准确性损失仅为 1％~1.5％。当在手机上采用 C3D 或 R(2+1)D 模型时，可以在 150ms 内完成 16 帧视频的计算。该工作由 CoCoPIE 团队：美国东北大学（Northeastern University）的王言治研究组、威廉与玛丽学院（William & Mary）的任彬研究组以及北卡罗来纳州立大学（North Carolina State University）的慎熙鹏研究组共同完成，发表于第 35 届美国人工智能协会年会（AAAI 2021）。

03

惠普游戏本曝内核级漏洞，影响全球数百万台计算机

HP OMEN 驱动程序软件中存在一个严重漏洞，该漏洞影响全球数百万台游戏计算机。

02

手机实时人工智能之「三维动作识别」:每帧只需9ms

本文提出了一种用于三维卷积神经网络（3D CNN）的模型压缩和移动加速框架 RT3D，通过结合神经网络权重剪枝和编译器代码优化技术，使模型的端到端运行时间与目前支持 3D CNN 的移动框架相比速度提升高达 29.1 倍，准确性损失仅为 1％~1.5％。当在手机上采用 C3D 或 R(2+1)D 模型时，可以在 150ms 内完成 16 帧视频的计算。该工作由 CoCoPIE 团队：美国东北大学（Northeastern University）的王言治研究组、威廉与玛丽学院（William & Mary）的任彬研究组以及北卡罗来纳州立大学（North Carolina State University）的慎熙鹏研究组共同完成，发表于第 35 届美国人工智能协会年会（AAAI 2021）。

02

回顾经典: AlexNet, CaffeNet — Winner of ILSVRC 2012

最近和同事交流很多来参加面试的应聘者的情况，很多都是介绍自己用了什么来做什么，但是对于内部的原理，都兵没有深入研究，现在深度学习框架都提供了非常便利的API，你可以轻松实现和搭建基础的网络，甚至可以直接照搬开源代码跑。

01

从论文到测试：Facebook Detectron开源项目初探

机器之心专栏作者：陈惠婵从 RCNN 到 Faster RCNN，再到最近的 FPN 和获得 ICCV Best Paper 的 Mask RCNN，深度学习在物体检测中以绝对优势从众多机器学习算法中脱引而出。大家对 Facebook 的计算机视觉研究项目的开源期盼已久，经过 1 年多的漫长等待，今天 Facebook 终于开源了 Detectron，Detectron 开源项目使用 caffe2 和 python 接口。实现了 10 多篇计算机视觉最新的成果。下面我们简单介绍一下 Detectron

学界 | 结合遗传算法与DNN的EDEN：自动搜索神经网络架构与超参数

机器之心编译参与：蒋思源在该论文中，研究者提出了一种进化深度网络（Evolutionary Deep Network/EDEN），即一种神经进化（neuro-evolutionary）算法。该算法结合了遗传算法和深度神经网络，并可用于探索神经网络架构的搜索空间、与之相关联的超参数和训练迭代所采用的 epoch 数量。机器之心简要介绍了该论文。论文地址：https://arxiv.org/abs/1709.09161 在 Emmanuel 等人的研究工作中，除了探索超参数和 epoch 数以外，他们还

06

利用TRansformer进行端到端的目标检测及跟踪（附源代码）

多目标跟踪(MOT)任务的关键挑战是跟踪目标下的时间建模。现存的用检测跟踪的方法采用简单的heuristics，如空间或外观相似性。这些方法，尽管其共性，但过于简单，不足以建模复杂的变化，如通过遮挡跟踪。所以现有的方法缺乏从数据中学习时间变化的能力。

02

面向超万卡集群的新型智算技术白皮书

自ChatGPT发布以来，科技界掀起了一场大模型的竞争热潮。数据成为新生产要素，算力成为新基础能源，大模型则成为新生产工具，各行各业从“+AI”向“AI+”的转变已势不可挡。随着模型参数量从千亿迈向万亿，模型能力更加泛化，大模型对底层算力的诉求进一步升级，万卡集群成为这一轮大模型基建军备竞赛的标配。

01

深度学习GPU工作站配置参考

CPU要求：在深度学习任务中，CPU并不负责主要任务，单显卡计算时只有一个核心达到100%负荷，所以CPU的核心数量和显卡数量一致即可，太多没有必要，但是处理PCIE的带宽要到40。

01

论如何利用可控参数拼接完成RCE

最近有个案例觉得挺有意思，可以分享一下。我们知道Windows里启动一个进程可以使用createprocess函数(https://docs.microsoft.com/en-us/previous-versions/aa908775(v=msdn.10))，大体上的使用可以看空白写的

01

拥抱云原生，如何选择最佳容器存储

云原生时代，容器凭借其易移植、云上云下自由运行、自由迁移的特点，得到了众多企业的青睐。容器是一种轻量的虚拟化技术，启动更快、占用资源更少，容器化已经成为企业数字化转型中IT建设的新方向。企业选择容器，除了容器技术优势，还具备高度灵活性，可避免被单一厂商所绑定，自由选择多家容器管理平台构建容器PaaS平台。

03

利用Transformer进行端到端的目标检测及跟踪（附源代码）

多目标跟踪(MOT)任务的关键挑战是跟踪目标下的时间建模。现存的用检测跟踪的方法采用简单的heuristics，如空间或外观相似性。这些方法，尽管其共性，但过于简单，不足以建模复杂的变化，如通过遮挡跟踪。所以现有的方法缺乏从数据中学习时间变化的能力。

03

视频直播与虚拟现实的渲染 - OpenGL ES

这是一篇OpenGL ES的学习笔记，介绍图像绘制里面用到的概念，学习OpenGL ES的基础知识备忘录。教程 OpenGLES入门教程1-Tutorial01-GLKit OpenGLES入门教程2-Tutorial02-shader入门 OpenGLES入门教程3-Tutorial03-三维变换 OpenGLES入门教程4-Tutorial04-GLKit进阶 OpenGLES进阶教程1-Tutorial05-地球月亮 OpenGLES进阶教程2-Tutorial06-光线 OpenGLE

08

川普的退休生活？不，是AI算法的宅舞演绎。

给定一张或者多张人物 A 的图像，和一段人物 B 的视频，就可以通过动作迁移算法自动合成一段人物 A 做任务 B 动作的视频。

01

文生图10倍速，视频实时渲染！清华发布LCM：兼容全部SD大模型、LoRA、插件等

‍Latent Consistency Models（潜一致性模型）是一个以生成速度为主要亮点的图像生成架构。

01

面向超万卡集群的新型智算技术白皮书

自ChatGPT发布以来，科技界掀起了一场大模型的竞争热潮。数据成为新生产要素，算力成为新基础能源，大模型则成为新生产工具，各行各业从“+AI”向“AI+”的转变已势不可挡。随着模型参数量从千亿迈向万亿，模型能力更加泛化，大模型对底层算力的诉求进一步升级，万卡集群成为这一轮大模型基建军备竞赛的标配。

03

业界 | 深度学习硬件对比评测：英特尔FPGA和英伟达GPU哪个更好？

选自Nextplatform 作者：Linda Barney 参与：李泽南、晏奇、黄小天、吴攀 FPGA 会随着深度学习的发展占领 GPU 的市场吗？英特尔的研究人员对目前最好的两种芯片做了对比。社交媒体和物联网正持续不断地以指数级方式产出语音、视频、图像等数字数据，这带动了对于数据分析（让数据变得可理解与可执行）的需求。数据分析经常依赖于机器学习（ML）算法。在众多机器学习算法中，深度卷积神经网络在重要的图像分类任务中具有当前最高的精确度，因而被广泛采用。在最近的「2017 现场可编程门阵列国际大会（

04

OpenAI：通过无监督学习提高语言理解能力

研究者通过一个可扩展的，与任务无关的系统获得了一系列不同语言任务的最新成果，这一系统也即将发布。此方法结合了两种现有的想法：Transformer和无监督的预训练。这些结果说明将监督学习方法与无监督预训练结合很好。

04

后Hadoop时代，爱奇艺如何有效整合大数据和AI平台？

大数据是人工智能的基础。从大数据到数据分析再到 AI 应用的转变，这也是一个很自然的发展过程。但是只有在数据、算法、企业的场景应用三者紧密配合的前提下，才可以有效地提升整个 AI 业务的流程。因此，爱奇艺在原来的数据积累基础上，进一步的完善了技术平台，形成了大数据 +AI 的统一架构，同时兼顾了数据、算法训练、人力物力算力等多方面的因素。那么爱奇艺在探索和实践过程中，有哪些沉淀出的经验可以分享给大家？InfoQ 采访了爱奇艺大数据计算团队负责人刘骋昺，得到了一个初步的了解。

02

业界 | 深度学习芯片公司Graphcore初探：颠覆GPU、FPGA和CPU的新一代处理器IPU

选自Nextplatform 作者：Nicole Hemsoth 机器之心编译参与：朱朝阳、侯韵楚、李亚洲、黄小天作为思维锻炼，让我们将神经网络视为大量的图形，把 CPU 视为一个更高级命令处理器

04

分布式深度学习GPU管理之Tiresias

给一个庞大的GPU集群，在实际的应用中，现有的大数据调度器会导致长队列延迟和低的性能，该文章提出了Tiresias，即一个GPU集群的调度器，专门适应分布式深度学习任务，该调度器能够有效率的调度并且合适地放置深度学习任务以减少他们的任务完成时间（JCT(Job Completion Time)），一个深度学习任务执行的时间通常是不可预知的，该文章提出两种调度算法，基于局部信息的离散化二维Gittins索引(Discretized Two Dimensional Gittins index)以及离散化二维LAS，对信息不可知并且能够降低平均的JCT，在实验中JCT能够快5.5倍，相比于基于Apache YARN的资源管理

05

DPU大热背后，NVIDIA的思考和布局

DPU火了，火的猝不及防又理所当然，甚至可以说DPU是当前芯片行业最热的方向，没有之一。

02

挑战性能极限小显卡大作为，教你如何在有限资源下运行大型深度学习模型，GPU显存估算并高效利用全攻略！

“10b”、“13b”、“70b” 等术语通常指的是大型神经网络模型的参数数量。其中的 “b” 代表 “billion”，也就是十亿。表示模型中的参数量，每个参数用来存储模型的权重和偏差等信息。例如：

01

【重磅】谷歌公布TPU细节之后，AI业界怎么看？

AI科技评论按：我们对于谷歌的TPU并不陌生，正是它支撑了AlphaGo强大快速的运算力，但谷歌一直未曾披露其细节，使得TPU一直保有神秘感。美国当地时间4月5日，谷歌终于打破了沉寂，发表官方博客，详细介绍了TPU的方方面面。相关论文更是配以彩色的TPU模块框图、TPU 芯片布局图、TPU印制电路......等等，可谓图文并茂，称其为“设计教程”也不为过。不出意料，这之后将会涌现一大批仿效者。论文中还给出TPU 与其它芯片的性能对比图，称“TPU处理速度比当前GPU和CPU要快15到30倍”。有人赞叹T

07

神经架构优化(NAO)：新的神经架构搜索(NAS)算法

本文为 AI 研习社编译的技术博客，原标题： Discovering the best neural architectures in the continuous space | Microsoft Research 作者 | Fei Tian 翻译 | 孙稚昊2 校对 | 酱番梨整理 | 菠萝妹原文链接： https://www.microsoft.com/en-us/research/blog/discovering-the-best-neural-architectures-i

03

算法+数据解构（第04篇）空间复杂度你真的懂了吗？

在本系列第1篇《走下神坛吧！算法》中提到了：计算复杂度分为时间复杂度与空间复杂度，第3篇《KO！大O——时间复杂度》详细介绍了时间复杂度，本篇文章来讲讲空间复杂度。

02

AutoML 和神经架构搜索初探

AI 研习社按：本文由「图普科技」编译自 An Opinionated Introduction to AutoML and Neural Architecture Search 。

02

干货 | AutoML 和神经架构搜索初探

AI 科技评论按：本文由「图普科技」编译自 An Opinionated Introduction to AutoML and Neural Architecture Search （http://www.fast.ai/2018/07/16/auto-ml2/#auto-ml）

02

ICLR 2020 | 完胜 BERT，谷歌最佳 NLP 预训练模型开源，单卡训练仅需 4 天

并且，在同等计算资源的情况下，ELECTRA 的性能优于现有方法；而在参数量只有 1/30 的情况下，取得不逊于最先进 BERT 系列模型的性能。

03

0585-Cloudera Enterprise 6.2.0发布

Cloudera在北京时间2019年3月30日正式发布了Cloudera Enterprise 6.2.0，此版本包括了许多新功能，可用性改进以及性能提升。Cloudera Enterprise 6.2.0同时也包括很多组件版本的更新，如下：

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭