英特尔Parallel Studio XE 在腾讯云上的实践:英特尔VTune Amplifier介绍和应用

  • 4 课时
  • 490 学过
  • 8 分
GPU 云服务器

课程概述

本课程讲帮助大家了解英特尔VTune Amplifier的基本功能和特点以及使用VTune的基础流程;了解如何使用VTune调试程序,包括如何使用VTune收集程序的性能数据,如何使用VTune查看收集的结果并发现性能瓶颈;了解其他的VTune使用技巧,例如命令行收集、远程收集、结果比较等。

【课程大纲】

1. 英特尔VTune Amplifier概述

2. 使用英特尔VTune收集数据

3. 英特尔VTune收集结果分析

4. 英特尔VTune其他使用技巧

机构简介

英特尔(Intel Corporation)

英特尔是半导体行业和计算创新领域的全球领先厂商,以智能互联技术奠定全球创新基石。英特尔创始于1968年,拥有50余年推动技术创新和耕耘产业生态的成功经验。如今,英特尔正转型为一家以数据为中心的公司。英特尔的战略愿景聚焦于三个方面:一是致力于生产世界上最好的半导体芯片;二是引领人工智能与“自能”革命;三是做全球领先的端到端技术平台提供者。英特尔正与合作伙伴一起,共推人工智能、自动驾驶、 5G及物联网等领域的技术创新与应用突破,驱动智能互联世界,从而解决人类面临的重大挑战。 英特尔于1985年进入中国,是在华高科技领域最大的外国投资企业之一,协议总投入约130亿美元。中国是英特尔全球战略之重点,英特尔在中国拥有美国总部之外最为全面的业务部署,覆盖了前沿研究、产品技术开发、精尖制造、产业生态合作、市场营销、客户服务、风险投资和企业社会责任等。英特尔中国现有员工约9,500人。扎根中国三十四年,英特尔见证并深度参与了中国的改革开放,从浦东开发、西部开发到振兴东北等,英特尔一直跟随改革开放的步伐,积极带动区域经济发展,为高端制造持续注入新动力。 2014年12月,英特尔宣布在未来15年将为成都工厂投资16亿美元,首次引入英特尔最先进的高端测试技术( ATT),使成都工厂在原有的芯片封装与测试业务之外进一步升级为英特尔在美国境外唯一的ATT技术工厂;该技术已于2016年11月18日正式投产。 2015年10月,英特尔宣布投资55亿美元,将英特尔大连工厂升级为非易失性存储技术制造基地;该项目已经于2016年7月正式投产, 2017年发布了两款全新的基于3D NAND的数据中心级固态盘;其二期项目已经在2018年9月投产英特尔最先进的96层3D NAND产品。英特尔中国研究院是英特尔全球五大创新中枢之一,而英特尔亚太研发中心已发展成为英特尔在亚洲最大的综合性研发基地之一。 英特尔中国积极履行企业社会责任,涵盖了人才培养、员工关爱、多元化和包容、环境可持续、供应链建设、志愿服务等领域。英特尔连续20多年被教育部评为最佳合作伙伴。我们持续支持英特尔杯嵌入式大赛、英特尔杯软件创新大赛和人工智能人才培养等项目,开展丰富多彩的校园活动,每年都有上万名学生的直接参与,受益青少年数以十万计。英特尔中国员工在2018年参与志愿活动人数达8,636人,贡献志愿服务时间超过12万小时,参与比例为69%; 10年来累计志愿服务时间超过72 万小时。我们把公司运营与环境可持续发展协调并进,积极减少碳足迹;还和政府、产业链以及公益组织深入合作,共同推动绿色可持续发展。全球独立机构声望研究院发布的“中国最具声望的公司”( RepTrak? 100) 2018年百强排行榜中,英特尔荣登榜首。

讲义

英特尔 VTune Amplifier1. 工具概述

Intel VTune Amplifier总览

Intel VTune Amplifier是Intel推出的一款功能强大、界面友好的应用程序调试和分析的工具。它可以帮助节省非常多原本用来进行应用程序调试和分析以及代码优化的时间。它支持针对于 C、C++,、Fortran、Python、Go、Java,以及任何混合编程的应用程序的性能调试和分析。它可以帮助优化CPU利用率、帮助调试多线程应用程序、内存和Cache的使用情况。同时,它提供非常丰富的分析的结果来帮助你非常快速的发现应用程序里面的性能瓶颈问题。另外,如果大家在使用VTune的过程中有任何的问题,可以通过优先支持来解决这样的问题。

2019版本的VTune中增加了一个新的独立的子工具,Platform Profiler。同时针对于应用程序调试和分析的工作流程做了一定程度的优化和简化。对于另外一个独立的子工具Application Performancel也做了一定程度的智能化和更加快速的、更新。针对于云端以及服务器端的应用程序,提升JIT功能。

Intel VTune Amplifier优势:

  • 多线程应用程序的性能调试和分析 在时间线上进行可视化的展示多线程的交互状况、分配更加均衡的工作量
  • 快速的发现答案 过滤筛选出需要重点关注的数据、在源代码层面或者在汇编代码的层面查看收集的Vtune结果
  • 可兼容性 支持微软的编译器、GCC和Intel的编译器编译出来的应用程序的性能调试、及时的支持最新的Intel处理器和其它的可兼容的处理器
  • Windows和Linux上完整的支持 支持在Windows和Linux上使用可视化界面或者在命令行上面进行程序的调试

下载安装Intel VTune Amplifier

  • 到官方网站下载https://software.intel.com/en-us/vtune/choose-download
  • 选择独立的VTune版本,然后单击下载按钮注册
  • 注册一个帐户以下载VTune。如果您已经拥有该帐户,请登录下载
  • 在“选择要下载的产品”中,为特定平台选择VTune:Windows、Linux和MacOS
  • 在“选择版本”中的列表中选择最新的VTune版本。默认情况下,它是最新版本
  • 单击“选择下载选项”中的按钮下载VTune。如果没有可用桌面,也可以在Linux终端中使用命令wget<vtune link address>
  • 如果有以下错误,在安装VTune之前,首先使用以下特定平台的命令安装丢失的库,例如:sudo apt get Install libasound2 libxss1 libgtk-3-0 libnss3 xorg openbox。
  • 确保腾讯云实例的Linux或Windows桌面可以成功初始化
  • 右键单击以打开终端仿真器
  • Intel VTune Amplifier源代码 source /opt/intel/vtune_amplifier/amplxe-vars.sh
  • 启动VTune GUI amplxe-gui

下载Intel VTune Amplifier实验结果

  • VTune矩阵结果的源代码可下载:https://software.intel.com/en-us/blogs/2019/09/16/intelr-vtune-amplifier-matrix-sample-results-on-linux
  • 直接从浏览器下载或使用wget下载matrix.ra
  • 解压缩matrix.rar文件并输入矩阵。Makefile、binary和VTune结果位于Linux目录中,源代码位于src目录中
  • 在VTune图形用户界面中打开VTune结果。

使用VTune的基本步骤

  1. 准备系统分析 本地主机与远程目标、必要时生成驱动程序/安装收集器
  2. 创建一个项目
  3. 设置目标和分析类型
  4. 开始分析
  5. 数据分析 在VTune中分析数据结果

课程评价(0)

感谢你参加本课程,请你作出评价:
0/300

以下选自学员评价

暂无精选评价