专家系统(Mindstudio Advisor) 是用于聚焦模型和算子的性能调优Top问题,识别性能瓶颈,重点构建瓶颈分析、优化推荐模型,支撑开发效率提升的工具。专家系统当前已经支持针对推理、训练、算子场景的瓶颈分析模型,包括内部团队开发的模型&算子瓶颈分析和优化推荐知识库、针对onnx模型的自动调优知识库,以及基于生态开发者开发的生态知识库。
好多天没有更新原创文章了,国庆前的一段时间确实比较忙,整个九月在参加各种面试,另外还有公司的项目,还有自己的毕设,另外还需要准备参加一些活动和讲座,时间排的很紧,不过还在这些事情基本在国庆来临之际都暂告一段落了,所以国庆我也没打算再干太多事情,就准备在家休养生息。
对于CVer来说,「代码和找代码」能力都是一种很重要的能力,毕竟idea再好只有通过代码实现出来才能发文章和刷榜。当我们阅读一篇高质量或者英文论文时,如何去找到该文章实现的代码,进而结合文章内容和代码实现去更好的理解作者所做的工作。只有自己跑一遍代码才能去改进网络,在研读大佬所写的代码的同时也能精进自己的代码能力。博主结合自己的经历,分享几个常用的找文章代码方式。
昇思MindSpore是一个全场景深度学习框架,旨在实现易开发、高效执行、全场景覆盖三大目标。
所以,他想给这些散落各地的模型,造一个整齐的家,人类就更容易找到自己心里的那个模型。
近年来,在全社会对隐私保护日益重视的背景下,联邦学习的研究和应用得到了长足发展。这一进步很大程度上得益于联邦学习框架及算法库的支持。当前,这类框架对联邦学习中各个参与方的通信、计算图的描述和拆分调度、模型的部署与推理等一般性的基础设施均有完整丰富的支持。但是,现有框架和库对图联邦的支持相对有限,难以基于已有工作去建立联邦图学习的基准。学术界和工业界都对一款功能全面且对实现联邦图学习算法友好的框架有强烈需求。 在最近的 KDD 2022 应用方向最佳论文获奖工作 FederatedScope-GNN 中,阿里
8 月 18 日,全球数据挖掘领域顶级会议 KDD 2022 大奖公布,阿里巴巴达摩院团队斩获应用科学方向“最佳论文奖”,这是中国企业首次获得该重磅奖项。
HelloGitHub 推出的《讲解开源项目》[1]系列。有幸邀请到了亚马逊 + Apache 的工程师:Lanking( https://github.com/lanking520 ),为我们讲解 DJL —— 完全由 Java 构建的深度学习平台。
机器之心发布 机器之心编辑部 8 月 18 日,全球数据挖掘领域顶级会议 KDD 2022 大奖公布,阿里巴巴达摩院团队斩获应用科学方向“最佳论文奖”,这是中国企业首次获得该重磅奖项。 KDD(ACM SIGKDD)是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,也是全球录取率最低的计算机顶会之一,在知识发现、数据挖掘、人工智能等领域具有重大影响力。KDD 组委会对达摩院获奖的联邦图学习开源工作 FederatedScope-GNN 给予充分肯定,评语提到,该工作“推动了联邦图学习技术的发展,并树
可解释性是深度学习中最具挑战性的方面之一。理解一个神经网络,它有成千上万的神经元分布在数千个隐藏层中。大多数深层神经网络的互联性和复杂性使其不适合于传统的调试工具。
昇思MindSpore是一个全场景深度学习框架,旨在实现易开发、高效执行、全场景统一部署三大目标。
深度学习是人工智能(AI)近几年重新走红的功臣,也是吞噬算力的巨大“黑洞”。据评估,仅对一个图像分类器进行训练,可能就需耗费次单精度操作[1]。在商业化深度学习应用纷纷落地的今天,用户的既有算力储备正受到前所未有的挑战。
6月9日消息,国产GPU厂商沐曦集成电路(以下简称“沐曦”)通过官方微信宣布,在6月7日于北京召开的第16届安博会上,沐曦(MetaX)展出了其首款AI推理GPU加速卡——曦思N100及解决方案在安防领域的应用。
https://github.com/CoCoPIE-Pruning/CoCoPIE-ModelZoo/tree/master/YOLObile
这里分享给大家一篇文章,文章里面列举了一些方法来将我们的 Python 代码提速,大家试试看。
原生的 Mac 当中只能右键新建文件夹,不能像 Windows 那样随时随地右键新建文件。比如右键一个 Word 文档、Excel 文档等,需要打开 Office 新建,然后另存为到我们想保存的地方。
很多学习 Python 的朋友会经常问从哪里找一些项目来练手,这里分享给大家几个不错的项目,希望对大家有帮助。
深度学习近来是机器学习最流行的子领域,因为针对高维数据拥有强大的建模能力,它在很多不同的任务与领域都绽放了夺目的光彩,例如计算机视觉、自然语言处理与智能体学习等。深度学习模型是一种表示学习方法,即根据模型学习表示的本身,而不仅仅如同传统机器学习那样将表示映射到输出。
首先,本文并不是利用Pytorch从头去实现Faster RCNN、Mask RCNN这两个结构的文章。如果有意向去从头实现并了解每一步细节可以看看下面这些视频和博客:
---- 新智元报道 编辑:桃子 好困 【新智元导读】这次,昇思大模型平台迎来了全新升级,不仅推出了大模型产业专区,而且还开放了AI画廊社交平台,让开发者找到创作乐趣。 自2019年开始,超大规模预训练模型逐渐涌出,到2020年发展到白炽化阶段。 1750亿参数的GPT-3大模型的发布,大模型参数规模实现了从亿级到千亿级的突破。 2022年ChatGPT的横空出世再次点燃了人工智能火炬,国内外大厂开始纷纷发布自家大模型。 可以说,大模型迈出了通用人工智能的第一步,作为未来社会技术突破与变革的关键力
ResNet、BERT、GPT、VGG、PGAN、MobileNet等深度学习领域的经典模型,只需输入一行代码,就能一键调用。
使用说明:https://mmclassification.readthedocs.io/en/latest/getting_started.html#inference-asingle-image
之前的华为诺亚实验室AutoML框架-Vega:(1) 介绍 已经介绍了相比于其他的AutoML框架, Vega框架的优点和特性。本文将从代码结构的角度来介绍Vega,帮助大家对Vega有一个全局的了解,主要起到一个帮助索引查找的作用。
摘要 深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。 机器学习与深度学习应用
明敏 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,KDD 2022所有奖项正式对外公布! 作为数据挖掘、知识发现领域的最高学术会议,每年KDD奖项花落谁家都会引发学界热烈讨论。 今年,中国团队的表现依旧令人瞩目。 清华裘捷中获得博士论文奖亚军,成为亚洲高校首位获得者。 阿里巴巴达摩院智能计算实验室,获得应用数据科学方向最佳论文奖,是中国工业界研究团队首次独立获得这一奖项。 论文提出了一个面向联邦图学习的库FederatedScope-GNN。 主办方SIGKDD评价其“推动了联邦图学习的
嗯,没错,PyEcharts 就是这么骚!嗯,没错,PyEcharts 就是这么骚!
AI的发展,除了要有应用的落地、芯片等技术的支撑,还离不开一个非常重要的基础——AI算法的框架。
BERT 带来的影响还未平复,CMU 与谷歌大脑提出的 XLNet 在 20 个任务上超过了 BERT 的表现,并在 18 个任务上取得了当前最佳效果。令人激动的是,目前 XLNet 已经开放了训练代码和大型预训练模型,这又可以玩一阵了~
在 2018 年时,Google 推出了《猜画小歌》应用:玩家可以直接与AI进行你画我猜的游戏。通过画出一个房子或者一个猫,AI 会推断出各种物品被画出的概率。它的实现得益于深度学习模型在其中的应用,通过深度神经网络的归纳,曾经令人头疼的绘画识别也变得易如反掌。现如今,只要使用一个简单的图片分类模型,我们便可以轻松的实现绘画识别。试试看这个在线涂鸦小游戏吧:
---- 新智元报道 编辑:LRS 好困 【新智元导读】中科大王杰教授团队联合华为诺亚提出分层序列模型,AI驱动数学规划求解器,大幅提升求解效率! 数学规划求解器因其重要性和通用性,被誉为运筹优化领域的「光刻机」。 其中,混合整数线性规划 (Mixed-Integer Linear Programming, MILP) 是数学规划求解器的关键组件,可建模大量实际应用,如工业排产,物流调度,芯片设计,路径规划,金融投资等重大领域。 近期,中科大 MIRA Lab 王杰教授团队和华为诺亚方舟实验室联合
计算机视觉是人工智能的眼睛,三维视觉的研究赋予这双眼睛探知真实空间纵深与距离的能力。
“ 阅读本文大概需要 7 分钟。 ”位运算是我们在编程中常会遇到的操作,但仍然有很多开发者并不了解位运算,这就导致在遇到位运算时会“打退堂鼓”。实际上,位运算并没有那么复杂,只要我们了解其运算基础和运算符的运算规则,就能够掌握位运算的知识。接下来,我们一起学习位运算的相关知识。 程序中的数在计算机内存中都是以二进制的形式存在的,位运算就是直接对整数在内存中对应的二进制位进行操作。注意:本文只讨论整数运算,小数运算不在本文研究之列位运算的基础我们常用的 3, 5 等数字是十进制表示,而位运算的基础是二进制。
本文提出了一种用于三维卷积神经网络(3D CNN)的模型压缩和移动加速框架 RT3D,通过结合神经网络权重剪枝和编译器代码优化技术,使模型的端到端运行时间与目前支持 3D CNN 的移动框架相比速度提升高达 29.1 倍,准确性损失仅为 1%~1.5%。当在手机上采用 C3D 或 R(2+1)D 模型时,可以在 150ms 内完成 16 帧视频的计算。该工作由 CoCoPIE 团队:美国东北大学(Northeastern University)的王言治研究组、威廉与玛丽学院(William & Mary)的任彬研究组以及北卡罗来纳州立大学(North Carolina State University)的慎熙鹏研究组共同完成,发表于第 35 届美国人工智能协会年会(AAAI 2021)。
机器之心 & ArXiv Weekly Radiostation 参与:杜伟、楚航、罗若天 本周主要论文包括阿里达摩院获 KDD 2022 最佳论文,这是国内企业首次获奖;Meta 发布 110 亿参数模型,击败谷歌 PaLM 等研究。 目录 FederatedScope-GNN: Towards a Unified, Comprehensive and Efficient Package for Federated Graph Learning High-Resolution Image Synthes
本文构建了一个能同时完成四个任务的的深度神经网络: 生成图像描述、生成相似单词、以图搜图和根据描述搜图。传统上这些任务分别需要一个模型,但我们现在要用一个模型来完成所有这些任务。
关于Mask R-CNN的详细理论说明,可以参见原作论文https://arxiv.org/abs/1703.06870,网上也有大量解读的文章。本篇博客主要是参考了PyTorch官方给出的训练教程,将如何在自己的数据集上训练Mask R-CNN模型的过程记录下来,希望能为感兴趣的读者提供一些帮助。
今天还是给大家推荐一篇 Python 优质文章,主要讲解 Python 中我们应该注意的一些规则。熟悉规则,并让自己的代码适应这些规则,可以帮助我们写出更地道的代码,事半功倍地完成工作。
MMYOLO 是一个基于 PyTorch 和 MMDetection 的 YOLO 系列算法开源工具箱,它是 OpenMMLab 项目的一部分。MMYOLO 定位为 YOLO 系列热门开源库以及工业应用核心库,其中实现了很多 YOLO 系列的算法(YOLOv5、v6、v7 以及 RTMDet-Rotated、RTMDet)。
AI 科技评论按:顾名思义,「表示」(representation)就是指在网络中对信息进行编码的方式。为了让大家充分理解「表示」,本文作者尝试构建一个能同时完成图像描述,相似词、相似图像搜索以及通过描述图像描述搜索图像四项任务的深度神经网络,从实操中让大家感受「表示」的奇妙世界。
之前在看Swin Transformer的时候,发现该算法在目标检测、实例分割等各种视觉任务上屠榜,于是想来实践测试一下。
【GiantPandaCV导语】这篇文章主要是讲解了如何给Jetson Nano装机,以及在Jetson Nano上如何配置TVM并将MxNet的ResNet18跑起来获取分类结果,最后我们还体验了一下使用AutoTVM来提升ResNet50在Jetson Nano上的推理效率,AutoTune了一个Task(一共需要AutoTune 20个Task)之后可以将ResNet50的推理速度做到150ms跑完一张图片(224x224x3),从上面的BenchMark可以看到TensorRT在FP32的时候大概能做到50-60ms推理一张图片(224x224x3)。本文所有实验代码均可以在这里找到:https://github.com/BBuf/tvm_learn/blob/main/relay ,如果你对学习TVM感兴趣可以考虑点个star。
【磐创AI 导读】:本篇文章讲解了PyTorch专栏的第四章中的微调基于torchvision 0.3的目标检测模型。查看专栏历史文章,请点击下方蓝色字体进入相应链接阅读。查看关于本专栏的介绍:PyTorch专栏开篇。
最近可能大家听到“数据中台”这个词越来越频繁了,有时候我跟一些朋友聊起来,也是都在说这个,但是一直不知道这到底是个什么。最近就看到这篇文章,觉得说的还挺好的,分享给大家看看,希望大家看完能对数据中台有一些认识。
如果大家对机器学习算法有所涉猎的话,想必你一定看过《统计学习方法》这本书,里面介绍了统计学中的一些基本算法和知识点,本文进行了详细的总结。
在本节中,您将基于从上一节中获得的理解,并开发更新的概念并学习用于动作识别和对象检测的新技术。 在本节中,您将学习不同的 TensorFlow 工具,例如 TensorFlow Hub,TFRecord 和 TensorBoard。 您还将学习如何使用 TensorFlow 开发用于动作识别的机器学习模型。
领取专属 10元无门槛券
手把手带您无忧上云