今天凌晨,英特尔在 Vision 2024 大会上展示了 Gaudi 3,这是其子公司 Habana Labs 的最新一代高性能人工智能加速器。
新的一年,英特尔要讲一个新故事。 作者丨鲁冬雪 编辑 | 陈彩娴 企业数字化来势汹汹,建设数字化所需的计算力、数据等智能技术的基础设施常被忽略。 然而,当降本增效成为企业发展的指导方针之一,数字化项目落地所涉及的方方面面也已经不容小觑。驱动算法与模型的数据与算力,也成为实现“降本增效”的重要手段。 例如,假设一个供应给终端硬件的视觉算法的交付时长是六个月,算法训练与调优原为2个月,企业调配2个算法工程师,一个算法工程师的年薪为100万,如果算法的训练速度可以提升10倍,那么对企业所产生的直接影响就是四个字:
1月11日下午,英特尔在北京召开了主题为“芯加速 行至远”的第四代至强新品发布会,正式推出代号为“Sapphire Rapids”的第四代英特尔至强可扩展处理器、英特尔至强CPU Max系列(代号“Sapphire Rapids HBM”)以及英特尔首个数据中心GPU Max系列(代号“Ponte Vecchio”),在实现数据中心性能、能效和安全性大幅跃升的同时,为AI、云、网络、边缘和全球领先的超级计算机带来全新功能。
但是现在,一个非常规的替代方案正在酝酿中。位于日本筑波的高能加速器研究组织(KEK)的一组研究人员认为,如果利用粒子加速器的力量,EUV光源的获取可能会更便宜、更快、更高效。
作者 | 鲁冬雪 数字化浪潮席卷全球,企业数字化转型步伐加速,上云、AI 产业化已成为企业数字转型的必选项,这直接催生了企业对计算力的澎湃需求。在如此强劲的市场需求下,数据中心作为信息基础设施逐渐火热,正在为 5G、人工智能、大数据等新兴技术提供重要的基础算力支持。 过去三年,企业数字化转型进入“精装修”时代,单个项目投入更注重效果和速度,更加希望找到投资小、见效快能持续迭代的投资。这意味着,企业不再只关注内部的管理,也不满足于系统和应用的成功上线,更多地以终为始,从提升企业的盈利能力、降本增效的实际价值
作者:重走此间路 编辑:闻菲 【新智元导读】单做算法无法挣钱,越来越多的公司都开始将核心算法芯片化争取更多市场和更大利益,一时间涌现出AI芯片无数。与CPU,GPU这样的通用芯片不同,终端AI芯片往往针对具体应用,能耗规格也千差万别。本文立足技术分析趋势,总结深度学习最有可能落地的5大主流终端市场——个人终端(手机,平板),监控,家庭,机器人和无人机,汽车,以及这些终端市场AI芯片的现状及未来。小标题以及着重部分是新智元转载时编辑增加,点击“阅读原文”了解更多。 近一年各种深度学习平台和硬件层出不穷,各种x
千平 李林 编译整理 量子位 出品 | 公众号 QbitAI 世界上最快的超级计算机在哪里? 刚刚发布的TOP500榜单表明,在超级计算机领域,中国已经全面压倒美国,成为世界第一。神威·太湖之光、天河
在人工智能热潮的大背景下,行业对 AI 计算集群的需求激增,对数据中心容量的需求也水涨船高,进而给电网、发电能力和环境带来了极大压力。数据中心容量严重制约着 AI 行业的发展,特别是在模型训练方面更是如此,因为用于训练的大量 GPU 一般需要放在一处才能实现速度飞快的芯片间网络连接。AI 推理能力则受到各个地区数据中心的容量的制约,新一代模型也进一步加重了推理层面的瓶颈。
1月11日,英特尔在北京召开了主题为“芯加速 行至远”的第四代至强新品发布会,正式推出第四代英特尔至强可扩展处理器(代号“Sapphire Rapids”),通过丰富的内置加速器提供领先的性能,解决客户在AI、分析、网络、安全、存储和科学计算领域面临的重大计算挑战,面向人工智能、云计算、数据分析等众多场景提供强劲算力。
近日,顶级机器学习开源库Hugging Face分享性能结果,展示了Habana® Gaudi®2 AI硬件加速器针对1760亿参数大模型卓越的运行推理速度。同时,该结果亦展现了在Gaudi2服务器上运行主流计算机视觉工作负载时的能效优势。
人工智能技术改变了我们的生活,而说到 AI 背后的算力,人们经常会先想到 GPU。从 2019 年英特尔为其第二代至强可扩展处理器增添了内置的深度学习加速技术后,原本定位通用计算的 CPU 芯片,也加入了为 AI 加速的行列。
机器之心报道 机器之心编辑部 英特尔在自己最擅长的 CPU 上完成了一次 AI 计算的革新。 人工智能技术改变了我们的生活,而说到 AI 背后的算力,人们经常会先想到 GPU。从 2019 年英特尔为其第二代至强可扩展处理器增添了内置的深度学习加速技术后,原本定位通用计算的 CPU 芯片,也加入了为 AI 加速的行列。 今天,代号为「Sapphire Rapids」的第四代至强可扩展处理器也在中国迎来发布首秀,除了一系列微架构的革新和技术规格的升级外,新 CPU 对 AI 运算「更上层楼」的支持也格外引人
选自The Next Platform 作者:Paul Teich 机器之心编译 参与:Nurhachu Null、黄小天 在最近的 2017 Google I/O 大会上,谷歌发布了 TPU2(第二代 TensorFlow 处理单元);近日,TIRIAS Research 的一位顶尖技术专家和首席分析师 Paul Teich 在 Nextplatform 发表文章,对 TPU2 机器学习集群做了深度揭秘,提出了一些不同观点,比如他认为 TPU2 是内部专属产品,Google 不太可能出售基于 TPU 的
---- 新智元报道 编辑:好困 David 袁榭 【新智元导读】最新超算Top500榜单揭晓!美国的性能怪兽Frontier以横扫之势拿下第一,算力超过身后468台的总和。 已经霸榜两年,完成四连冠的日本富岳终于跌落了「神坛」。 在刚刚公布的2022年全球超算Top500名单中,美国橡树岭国家实验室(ORNL)的Frontier夺得第一。 凭借1.102 Exaflop/s的HPL分数,Frontier不仅是有史以来最强大的超级计算机,它也是第一台真正的「E级超算」。 相比之下,中国的神威·
Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手,目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件,特别是用于运行和训练 Meta AI 模型的芯片。
之前我们写过让Jetson TX2火力全开的秘密,让大家知道命令行工具nvpmodel能够定义一组参数,从而有效地定义给定功率的性能。
北京时间 9 月 26 日,在英伟达 GPU 技术峰会上,英伟达创始人兼 CEO 黄仁勋正式发布 TensorRT 3 神经网络推理加速器。据官方介绍,TensorRT 3 能极大改善处理性能,削减从云到边缘设备(自动驾驶汽车、机器人等)的推理开销。 TensorRT 3 是在 Volta GPU 实现最优推理性能的关键,比起 CPU 它能实现高达 40 倍的吞吐量,时延在 7ms 之内。目前,对于英伟达开发者计划成员,现在有针对 Tesla GPU (P4, P100, V100) 和 Jetson 嵌入
二十大报告指出,推动经济社会发展的绿色化、低碳化是实现高质量发展的关键环节。要大力发展绿色低碳产业,健全资源环境要素市场化配置体系,加快节能降碳先进技术的研发和推广应用,倡导绿色消费,从而推动形成绿色低碳的生产方式和生活方式。
昨天,深耕人工智能加速器领域的 Imagination Technologies带来了一款瞄准ADAS的神器----多核IMG Series4 NNA,号称为ADAS而生的终极AI加速器!其多核算力可以高达600 TOPS!而且,它不止可以应用在ADAS领域还可以应用到更多领域!牛!
安妮 陈桦 编译自 The Next Platform 量子位 报道 | 公众号 QbitAI 在上周召开的Google I/O 大会上,谷歌正式公布了第二代TPU,又称Cloud TPU或TPU 2。但是,谷歌并没有详细介绍自己的新芯片,只展示了一些照片。 The Next Platform今天发布一篇文章,基于谷歌提供的图片和细节,带你深入了解谷歌的TPU2。量子位编译如下: 首先要说明的一点是,谷歌不太可能向公众出售TPU的芯片、主板或是服务器。目前看来,TPU2还是一个只供内部使用的产品。只有极少数
news.accelerationrobotics.com/hardware-accelerating-ros-2-nodes
现在让我们深入了解我们的Jetson平台。这些是我们的Jetson Orin模块,我们有七种不同的模块,涵盖了从入门级到高性能的整个系列。最棒的是,与以往不同的是,我们在整个产品系列上首次采用了一种SOC(片上系统)架构。从入门级到高性能,全部都是基于同一架构,这也使得产品更加可扩展和易于从一个模块转移到另一个模块。
11月11日~16日,2018年全球超算领域年度盛会、全球超级计算大会(SC18)在美国得克萨斯州达拉斯召开。昨天,Nvidia CEO黄仁勋发表了主旨演讲,简单说,就是未来计算的大旗放心交给英伟达来抗。
【新智元导读】在近日举行的ISC会议上,最新Top500榜单公布了。这次,榜单顶部的排名变化较大,美国Summit超级计算机摘得桂冠,中国的神威·太湖之光排名第二。这是自2012年11月以来,美国第一次宣布全球最强大超级计算机,重夺超算霸主地位。但在进入榜单的系统数量方面,中国仍然远超美国。
新智元推荐 作者:Pete Warden 翻译:专知(ID:Quan_Zhuanzhi)Yongxi, Huaiwen 编辑:克雷格 【新智元导读】数据科学家,Jetpac 公司CTO Pete
---- 新智元报道 编辑:拉燕 Aeneas 【新智元导读】全世界都在卷大模型,小扎也急了。如今,Meta为了发展AI,在定制芯片和超算上下了大赌注。 Meta也有纯自研芯片了! 本周四,Meta发布第一代AI推理定制芯片MTIA v1和超算。 可以说,MTIA对Meta是一个巨大的福音,尤其是现在各家都在卷大模型,对AI算力的需求变得越来越高。 小扎最近表示,Meta看到了「以有用和有意义的方式向数十亿人介绍人工智能代理的机会」。 显然,随着Meta加大对AI的投入,MTIA芯片和超算计划将是
超级计算机可以说是科学计算界的奥运冠军。通过数值模拟,超级计算机丰富了我们对世界的理解:无论是宇宙中数光年之外的恒星、地球的天气和气候,还是人体的运作机理。
三星和百度本周表示,两家公司将在2020年初开始批量生产AI加速器芯片。百度的昆仑芯片将使用三星成熟的14纳米制程技术制造,并使用三星的Interposer-Cube 2.5 D包装结构。
AI科技评论按:今年是英伟达 GTC(GPU 技术大会)在中国举办的第二年。在 AI 革命势头正劲之际,英伟达创始人兼 CEO 黄仁勋亮相北京。据了解,为期三天的 GTC 盛会将吸引超过 3500 名科学家、工程师和媒体参加。 首日的英伟达GPU技术峰会上,由英伟达创始人兼CEO黄仁勋宣布了一系列重要消息,包括新版神经网络推理加速器TensorRT 3,与国内OEM厂商联合推出基于 Tesla V100 的 HGX-1 加速器,此外还有更多关于自动驾驶的新动态。本文将围绕英伟达 TensorRT 3 与自动
这里是 6 月 20 日的每日1句话新闻晚报,只需1分钟,看看全球最热、最新的区块链新闻。
导读:在2018人工智能计算大会上,丛京生发表“可定制计算与AI”的演讲。丛京生提出,计算能力的提高,让今天的AI无处不在。而当前计算的瓶颈是能耗和能效的问题。可定制计算将对AI的发展起到重要作用,同时,AI的发展对可定制化计算也有很大的帮助。目前的工作是想让AI芯片的设计民主化,让人人都可以设计电路。
9月27日消息,全球知名半导体制造商ROHM(总部位于日本京都市)开发出、设备端学习AI芯片(配备设备端学习AI加速器的SoC),该产品利用 AI(人工智能)技术,能以超低功耗实时预测内置电机和传感器等的电子设备的故障(故障迹象检测),非常适用于IoT领域的边缘计算设备和端点。
点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息 2023年4月,AMD正式发布首款5nm 基于ASIC的多媒体加速卡——Alveo MA35D。相较上一代Alveo U30, Alveo MA35D实现了全面提升,在保证成本效益的同时,实现了高密度和低延时等性能上的突破。其AI+转码的视频处理能力更是顺应了AI时代。AMD坚持从客户侧出发,提供经济高效的服务,开启规模交互式媒体新时代
【新智元导读】Google Colab现在提供免费的T4 GPU。Colab是Google的一项免费云端机器学习服务,T4GPU耗能仅为70瓦,是面向现有数据中心基础设施而设计的,可加速AI训练和推理、机器学习、数据分析和虚拟桌面。
机器之心报道 机器之心编辑部 2018 年 1 月 9 日-12 日,最新一届的 CES 将在美国拉斯维加斯开幕。作为世界上最大、影响最为广泛的消费类电子技术年展,CES 可谓是全球最大的消费技术产业盛会。但今年的 CES 与往年不同的是,人工智能应用产品也纷纷亮相。在今天中午的新闻发布会上,英伟达 CEO 黄仁勋为我们介绍了英伟达的 GPU,发布了面向自动驾驶的处理器 Drive Xavier。 众所周知,深度学习是随着 GPU 技术的发展而兴起的,英伟达在这个过程中所扮演的角色不言而喻。所以在登上讲台
这是一次巨大的转变,但对所有以计算为中心的平台供应商而言,这个过程终将——在某些情况下逐渐地发生。
尽管人工智能和机器学习应用的加速仍是一个相对较新的领域,但各种处理器如雨后春笋般涌现,几乎可以加速任何神经网络工作负载。
夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI 英伟达再次带来新“核弹”。 在刚刚结束的英伟达发布会上,黄仁勋正式发布了DRIVE Xavier,这是一款为无人车准备的AI超级计算芯片,也
2016/6/20日Top500公布最新一届榜单,中国的“神威-太湖之光”超级计算机登顶第47届Top500榜单。 http://www.top500.org/news/new-chinese-supercomputer-named-worlds-fastest-system-on-latest-top500-list/ 使用LINPACK基准测试,“神威-太湖之光”系统计算能力达到了93 petaflop/s,国家并行计算研究中心负责研制,安装在无锡国家超算中心的神威取代了天河2成为了第一。 2016/
北京时间4月9日晚间,英特尔在美国召开了“Intel Vision 2024”大会,介绍了英特尔在AI领域取得的成功,并发布了新一代的云端AI芯片Gaudi 3及第六代至强(Xeon)可扩展处理器,进一步拓展了英特尔的AI产品路线图。
美国能源部(DOE)和国家核安全局近日宣布,超算制造商Cray的Shasta超级计算平台将成为El Capitan的支柱。这台美国军火库中新的首屈一指的超级计算机将达到1.5 EP的算力,比现有最快的超级计算机快10倍。
现在加速器随处可见。各个城市,大学,投资机构甚至是乡村都在积极拥抱创业加速器,他们认为有了加速器就能表示他们对创新和创业非常友好,非常支持了。他们认为有了加速器就能很快并且很容易地吸引年轻人、支持当地经济发展,将人们和全球经济联系起来。而且加速器这个领域基本上没有进入壁垒,几乎每个有无线网络和开放式办公空间的地方都可以自称是加速器。每个加速器的水平参差不齐,而且直到最近也没有人对加速器进行过评估。 最近,Unitus 种子基金,作为一家有影响力的投资机构,发布了一份关于全世界范围内加速器业绩的调查。该报告
编译:闻菲 张乾 司明 【新智元导读】上周,Alphabet/谷歌迎来了新任董事长、曾经的斯坦福大学校长John Hennessy。这是“AI带头大哥”谷歌内部带头大哥的更替,意义重大,影响乃至会决定谷歌“AI First”口号的落实。Hennessy作为计算机体系结构宗师,他在硬件方面的背景也意味着谷歌从传统的互联网/软件公司进一步升级,以TPU为核心,在AI云上与亚马逊、微软展开角逐。 美国当地时间 2 月 1 日,Google 母公司 Alphabet 在财报会议上宣布,John Hennessy 将
英特尔在2018年11月推出第二代类神经网路运算装置,称为Neural Compute Stick 2,采用新一代的视觉运算处理器Movidius Myriad X,提供8倍的效能增长。
选自Medium 作者:Eugenio Culurciello 机器之心编译 参与:Rick R、吴攀 在这篇文章中,作者Eugenio Culurciello简述了几类硬件设计,希望能为大家更快的运行神经网络提供洞见。 我喜欢深度学习... 深度学习最近取得的成功势不可挡:从图像分类和语音识别到图片标注、理解视觉场景、视频概述、语言翻译、绘画,甚至是生成图像、语音、声音和音乐! …而我想让它运行得飞快! 其成果令人震惊,因而需求就会增长。比如你是谷歌/ Facebook / Twitter 的工作人员
原文:Timothy Prickett Morgan 翻译:GPU世界 美国能源部的橡树岭国家实验室的“Summit”pre-exascale 超级计算机,计划在2017年年底到2018年年初建成,看
首先,让我们来了解一下是什么在推动边缘的人工智能的发展。传感器技术和经济的进步创造了联网设备的繁荣,也被称为物联网。这些设备正在提高生产力。
6月30日,“开源向善 应云而生”腾讯云原生加速器首期入选企业名单正式公布,Kyligence、StreamNative、偶数科技、TreeLab、XSKY星辰天合、Open AI Lab开放智能等38家优秀云原生企业,从全球500多家参与企业中脱颖而出,携手腾讯共建云原生生态,面向云原生未来加速启航。 产业数字化浪潮中,云原生已成大势。企业发展中的开发、运维、管理等环节日趋复杂,云原生技术为企业提供了面向未来的信息化平台构建方式,并已逐渐开始融入各行各业。腾讯积极构建云原生生态,联手生态伙伴,共同
领取专属 10元无门槛券
手把手带您无忧上云