开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

用C/C++实现FPGA - CPU的延迟测量

FPGA（Field-Programmable Gate Array）是一种可编程逻辑器件，它可以通过编程来实现特定的功能。延迟测量是评估FPGA与CPU之间通信的时间延迟的过程。

在使用C/C++语言实现FPGA - CPU的延迟测量时，可以通过以下步骤进行：

首先，需要了解FPGA的编程模型和接口。FPGA通常使用硬件描述语言（HDL）进行编程，如VHDL或Verilog。通过编写HDL代码，可以定义FPGA的逻辑功能和输入输出接口。
在C/C++中，可以使用FPGA开发工具提供的API或库来与FPGA进行通信。这些API或库提供了与FPGA通信的函数和数据结构，可以通过它们来配置FPGA、发送数据以及接收来自FPGA的响应。
在C/C++代码中，可以使用计时函数或定时器来测量FPGA与CPU之间的延迟。通过在发送数据到FPGA之前记录时间戳，并在接收到FPGA响应后再次记录时间戳，可以计算出通信的延迟时间。
为了准确测量延迟，需要进行多次测试并取平均值。可以使用循环结构来重复执行通信过程，并在每次迭代中记录延迟时间。最后，计算平均延迟时间以获得更准确的结果。

FPGA - CPU的延迟测量可以应用于许多领域，例如高性能计算、通信系统、嵌入式系统等。通过测量延迟，可以评估系统的性能和响应时间，并进行优化。

腾讯云提供了一系列与FPGA相关的产品和服务，例如FPGA云服务器（FPGA Cloud Server）和FPGA开发套件（FPGA Development Kit）。这些产品和套件可以帮助开发者在云环境中使用FPGA，并提供了丰富的开发工具和资源。

更多关于腾讯云FPGA产品和服务的信息，可以访问以下链接：

请注意，以上答案仅供参考，具体实现方法和推荐产品可能会根据实际需求和环境而有所不同。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

ACAP不可不知的几个基本概念

ACAP（Adaptive Compute Acceleration Platform）是Xilinx推出的具有革命性的异构计算平台，它将上述三种处理机制融合在一起，如下图所示（图片来源：Figure 3, wp 505, Xilinx）。

02

【开源】竖亥：实测FPGA平台上HBM的惊人带宽！

随着高带宽内存（HBM）的发展，FPGA正变得越来越强大，HBM 给了FPGA 更多能力去缓解再一些应用中遇到的内存带宽瓶颈和处理更多样的应用。然而，HBM 的性能表现我们了解地还不是特别精准，尤其是在 FPGA 平台上。这篇文章我们将会在HBM 的说明书和它的实际表现之间建立起桥梁。我们使用的是一款非常棒的 FPGA，Xilinx ALveo U280，有一个两层的HBM 子系统。在最后，我们提出了竖亥，一款让我们测试出所有HBM 基础性能的基准测试工具。基于FPGA 的测试平台相较于CPU/GPU 平台来说会更位准确，因为噪声会更少，后者有着复杂的控制逻辑和缓存层次。我们观察到 1）HBM 提供高达425 GB/s 的内存带宽，2）如何使用HBM 会给性能表现带来巨大的影响，这也印证了揭开 HBM 特性的重要性，这可以让我们选择最佳的使用方式。作为对照，我们同样将竖亥应用在DDR4上来展现DDR4 和HBM 的不同。竖亥可以被轻松部署在其他FPGA 板卡上，我们会将竖亥开源，造福社会。

04

从FPGA说起的深度学习（一）

这是新的系列教程，在本教程中，我们将介绍使用 FPGA 实现深度学习的技术，深度学习是近年来人工智能领域的热门话题。

04

使用 CCIX进行高速缓存一致性主机到FPGA接口的评估

摘要：长期以来，大多数分立加速器都使用各代 PCI-Express 接口连接到主机系统。然而，由于缺乏对加速器和主机缓存之间一致性的支持，细粒度的交互需要频繁的缓存刷新，甚至需要使用低效的非缓存内存区域。加速器缓存一致性互连 (CCIX) 是第一个支持缓存一致性主机加速器附件的多供应商标准，并且已经表明了即将推出的标准的能力，例如 Compute Express Link (CXL)。在我们的工作中，当基于 ARM 的主机与两代支持 CCIX 的 FPGA 连接时，我们比较了 CCIX 与 PCIe 的使用情况。我们为访问和地址转换提供低级吞吐量和延迟测量，并检查使用 CCIX 在 FPGA 加速数据库系统中进行细粒度同步的应用级用例。我们可以证明，从 FPGA 到主机的特别小的读取可以从 CCIX 中受益，因为其延迟比 PCIe 短约 33%。不过，对主机的小写入延迟大约比 PCIe 高 32%，因为它们携带更高的一致性开销。对于数据库用例，即使在主机-FPGA 并行度很高的情况下，使用 CCIX 也可以保持恒定的同步延迟。

04

GPU 编程相关简要摘录

GPU 编程可以称为异构编程，最近由于机器学习的火热，很多模型越来越依赖于GPU来进行加速运算，所以异构计算的位置越来越重要；异构编程，主要是指CPU+GPU或者CPU+其他设备（FPGA等）协同计算。当前的计算模型中，CPU主要用来进行通用计算，其更多的是注重控制，我们可以通过GPU和FPGA等做专用的计算。

03

基于FPGA异构计算快速构建高性能图像处理解决方案

大家好，我是深维科技创始人/CEO 樊平，非常高兴有这个机会跟大家分享和交流一下，如何基于FPGA来构造高性能的图像处理解决方案。

01

FFShark-一种可以监控全世界网络的100G可编程智能NIC

最近几天，老美又加大了对华为的约束，几乎将华为逼上绝路。老美之所以费尽心机的制裁华为，最重要的原因就是以5G为代表的网络战略地位的抢夺。网络，已不仅仅是数据通道，而是能够传输互联网时代生命之水的渠道。对数据而言，网络就是上帝。谁主宰了网络，谁就能够掌控未来！而华为现在就是能够修这条新水渠的中国企业，而以前的旧水渠是美国人修的，并且让特朗普恼火的是，华为修这条新的水渠比他们修的快，还修的好。

03

一种可以监控全世界网络的可编程智能NIC

最近几天，老美又加大了对华为的约束，几乎将华为逼上绝路。老美之所以费尽心机的制裁华为，最重要的原因就是以5G为代表的网络战略地位的抢夺。网络，已不仅仅是数据通道，而是能够传输互联网时代生命之水的渠道。对数据而言，网络就是上帝。谁主宰了网络，谁就能够掌控未来！而华为现在就是能够修这条新水渠的中国企业，而以前的旧水渠是美国人修的，并且让特朗普恼火的是，华为修这条新的水渠比他们修的快，还修的好。

02

交易延迟：看这里！

无论交易执行的速度有多快，由于各方之间设备的数量和类型，总是会有一些延迟。这就是所谓的交易延迟。比如通过路由器和交换机等网络设备长距离发送数据所需的时间导致数据中心、广域网的延迟。除了由网络造成的延迟之外，还有由其相关的存储设备造成的延迟。

05

ROS 2 感知节点的硬件加速

news.accelerationrobotics.com/hardware-accelerating-ros-2-nodes

04

RecoNIC 入门：SmartNIC 上支持 RDMA 的计算卸载-FPGA-智能网卡-AMD-Xilinx

当今的数据中心由数千台网络连接的主机组成，每台主机都配有 CPU 和 GPU 和 FPGA 等加速器。这些主机还包含以 100Gb/s 或更高速度运行的网络接口卡 (NIC)，用于相互通信。我们提出了 RecoNIC，这是一种基于 FPGA、支持 RDMA 的 SmartNIC 平台，旨在通过使网络数据尽可能接近计算来加速计算，同时最大限度地减少与数据副本（在以 CPU 为中心的加速器系统中）相关的开销。由于 RDMA 是用于改善数据中心工作负载通信的事实上的传输层协议，因此 RecoNIC 包含一个用于高吞吐量和低延迟数据传输的 RDMA 卸载引擎。开发人员可以在 RecoNIC 的可编程计算模块中灵活地使用 RTL、HLS 或 Vitis Networking P4 来设计加速器。这些计算块可以通过 RDMA 卸载引擎访问主机内存以及远程对等点中的内存。此外，RDMA 卸载引擎由主机和计算块共享，这使得 RecoNIC 成为一个非常灵活的平台。最后，我们为研究社区开源了 RecoNIC，以便能够对基于 RDMA 的应用程序和用例进行实验

01

干货 | 多伦多大学博士生赵舒泽：如何在FPGA上实现动态电压的调节？

AI 科技评论按：说起 FPGA，很多人可能都不熟悉，它的英文全称为 Field Programmable Gate Array，即现场可编程门阵列，也被称为可编程集成电路。随着大数据以及 AI 的发展，越来越多的数据中心引入 FPGA 作为 CPU 的加速器以提高数据处理速度，提升服务器性能，因此降低 FPGA 的能耗也成为数据中心里新的挑战。本文介绍了其中一种降低 FPGA 能耗的方法——基于自测量的 FPGA 动态电压调节解决方案。本文根据嘉宾的直播分享整理而成。动态电压调节（DVS）作为常见的数字

06

业界首个NIC中PCIe性能测试基准程序公布！

近年来，在可编程NIC的发展和可用性的推动下，终端主机逐渐成为核心网络功能(如负载平衡、拥塞控制和特定应用网络卸载)的实施点。然而，在可编程NIC上实现定制设计并不容易:许多潜在的瓶颈会影响性能。

02

微软Azure加速网络：公共云中的SmartNIC

来源：内容由「网络交换FPGA」编译自「nsdi18」，谢谢。Azure是数据中心的行业标杆，其应用规模和技术都是非常值得借鉴的，文中总结了来自产业界宝贵的经验和教训，探讨为何FPGA是最适合数据中心架构的原因。故翻译此文。

03

P4用软件实现和硬件实现的区别

摘要：我们目前看到从可配置性有限的固定功能网络设备向具有完全可编程处理流水线的网络设备的转变。这种发展的一个突出例子是P4，它提供了一种语言和参考架构模型来设计和编程网络设备。这个参考模型的核心元素是可编程匹配动作表，它定义了网络数据包的处理步骤。在本文中，我们演示了这些表，我们使用它们来创建自己的建模框架，它们是设备性能的关键驱动因素。

03

FPGA和CPLD对比与入门

1、EMP240使用很广泛了，8元一片。EMP240顾名思义具有240个宏单元，或者说240个触发器，或者理解成240个bit的存储单元。

02

腾讯 FPGA 云 : 背后的技术

本文介绍了FPGA云在云计算2.0时代作为“芯”力量的重要性，主要内容包括FPGA云技术的基本定义、发展历程、市场前景、典型应用场景以及FPGA云技术的核心优势。同时，本文还探讨了FPGA云在云计算领域的应用前景，认为FPGA云技术将逐渐替代传统的ASIC云技术，并引领云计算行业进入一个全新的时代。

03

Xilinx：让FFmpeg在FPGA上玩的爽

LiveVideoStack：你好Sean，请向我们LiveVideoStack读者介绍下自己及加入Xilinx的相关背景。

01

专访丨腾讯云 FPGA 团队：FPGA 云服务器给产业链带来了哪些价值？

日前，国内云服务商腾讯云宣布推出FPGA云服务器，引起了业界一阵热议，这是继国外亚马逊以及微软等企业在数据中心做出部署FPGA的尝试之后，国内首个FPGA云服务器。短短一年的时间，国内外主流云服务企业

04

PCIE-1756定制FPGA实现生产线高速视觉检测控制

制药企业在生产线上需要对药品进行信息采集和管理，视觉检测是很重要的手段，通过运用计算机CPU的高速运算，对拍到的信息进行快速分析，以判定产品是否合格，并在产品到达下一关口之前通过数字量输出进行开关量控制。

04

FPGA，你为什么这么牛？

众所周知，通用处理器（CPU）的摩尔定律已入暮年，而机器学习和 Web 服务的规模却在指数级增长。

04

深度 | 如何评价微软在数据中心使用 FPGA ？

AI 科技评论按：本文作者李博杰，本文整理自知乎问题《如何评价微软在数据中心使用 FPGA 代替传统 CPU 的做法？》下的回答，AI 科技评论授权转载。

01

深度 | 如何评价微软在数据中心使用 FPGA ？

问题「用 FPGA 代替 CPU」中，这个「代替」的说法不准确。我们并不是不用 CPU 了，而是用 FPGA 加速适合它的计算任务，其他任务仍然在 CPU 上完成，让 FPGA 和 CPU 协同工作。本回答将涵盖三个问题：为什么使用 FPGA，相比 CPU、GPU、ASIC（专用芯片）有什么特点？微软的 FPGA 部署在哪里？FPGA 之间、FPGA 与 CPU 之间是如何通信的？未来 FPGA 在云计算平台中应充当怎样的角色？仅仅是像 GPU 一样的计算加速卡吗？一、为什么使用 FPGA？众所

04

如何评价微软在数据中心使用FPGA代替传统CPU的做法？

编者按：本文系微软亚洲研究院实习生李博杰在知乎上针对“如何评价微软在数据中心使用FPGA代替传统CPU的做法？”问题的回答。AI科技评论已获得转载授权。首先，原问题「用 FPGA 代替 CPU」中，这个「代替」的说法不准确。我们并不是不用 CPU 了，而是用 FPGA 加速适合它的计算任务，其他任务仍然在 CPU 上完成，让 FPGA 和 CPU 协同工作。本文将涵盖三个问题：为什么使用 FPGA，相比 CPU、GPU、ASIC（专用芯片）有什么特点？微软的 FPGA 部署在哪里？FPGA 之间、

深度学习模型在FPGA上的部署

我是来自山区、朴实、不偷电瓶的AI算法工程师阿chai，给大家分享人工智能、自动驾驶、机器人、3D感知相关的知识

03

大话FPGA-“万能的芯片？”

但是如果我们深入到大芯片的底层，就会发现这些大芯片也是一个与非门，或非门，等逻辑门组成的。

01

做机器视觉哪个软件好？

在构建机器视觉系统时，开发人员可以选择众多知名公司的商用软件包。然而，在选择这类软件时，重要的是理解这些软件提供的功能、支持的硬件以及如何轻松地配置这样的软件，以解决特定的机器视觉任务。

01

【BDTC先睹为快】赖兆红：如何构建低延时大数据系统平台

2014年12月12-14日，由中国计算机学会（CCF）主办，CCF大数据专家委员会协办，中科院计算所与CSDN共同承办的2014中国大数据技术大会(Big Data Technology Conference 2014，BDTC 2014)将在北京新云南皇冠假日酒店拉开帷幕。大会为期三天，以推进行业应用中的大数据技术发展为主旨，拟设立“大数据基础设施”、“大数据生态系统”、“大数据技术”、“大数据应用”、“大数据互联网金融技术”、“智能信息处理”等多场主题论坛与行业峰会。由中国计算机学会主办，CCF大数

06

CPU和GPU双低效，摩尔定律之后一万倍 ——写于TPU版AlphaGo重出江湖之际

【新智元导读】本文来自计算机体系结构专家王逵。他认为，“摩尔定律结束之后，性能提升一万倍”不会是科幻，而是发生在我们眼前的事实。 2008年，《三体2：黑暗森林》里写到：真的很难，你冬眠后不久，就有六个新一代超级计算机大型研究项目同时开始，其中三个是传统结构的，一个是非冯结构的，另外两个分别是量子和生物分子计算机研究项目。但两年后，这六个项目的首席科学家都对我说，我们要的计算能力根本不可能实现。量子计算机项目是最先中断的，现有的物理理论无法提供足够的支持，研究撞到了智子的墙壁上。紧接着生物分子计算机项目也

07

「科技·TEG」沉吟至今，生而为云 - 异构FPGA在云端一次算力的升华

1 背景随着以数据中心为核心的云计算的兴起，传统计算领域不断被蚕食。各大公司纷纷出手，构成形如战国七雄的乱战格局：Amazon、Google、Facebook、Microsoft、阿里、腾讯、百度。在吃瓜群众眼中，云计算体大量足，实力强劲，于是，以机器学习、物联网、视频、科学计算、金融分析等大数据制造者为首的大量任务在云端构成了长长的计算队列。思科云指数报告指出，预计到2020 年，全球 92% 的数据流量将来自云计算，将从2015 年的每年 3.9 ZB 增长 3.7 倍，到 2020 年达到 14

02

基于FPGA的伪随机序列发生器设计

1）LFSR:线性反馈移位寄存器（linear feedback shift register, LFSR）是指给定前一状态的输出，将该输出的线性函数再用作输入的移位寄存器。异或运算是最常见的单比特线性函数：对寄存器的某些位进行异或操作后作为输入，再对寄存器中的各比特进行整体移位。

03

【论文解读】Faster sorting algorithm

基本的算法，如排序或哈希，在任何一天都被使用数万亿次。随着对计算需求的增长，这些算法的性能变得至关重要。尽管在过去的2年中已经取得了显著的进展，但进一步改进这些现有的算法路线的有效性对人类科学家和计算方法都是一个挑战。在这里，论文展示了人工智能是如何通过发现迄今为止未知的算法路线来超越目前的最先进的方法。为了实现这一点，论文将一个更好的排序程序制定为单人游戏的任务。然后，论文训练了一个新的深度强化学习代理AlphaDev来玩这个游戏。AlphaDev从零开始发现了一些小型排序算法，它优于以前已知的人类基准测试。这些算法已经集成到LLVM标准C++排序库中。对排序库的这一部分的更改表示用使用强化学习自动发现的算法替换组件。论文还在额外的领域中提出了结果，展示了该方法的通用性。

03

专访 | UIUC陈德铭教授：「万能芯片」FPGA与深度学习

人工智能的风潮从技术一路蔓延到硬件，让「芯片」成为今年行业里盛极一时的主题。人们关注通用芯片领域里 CPU 和 GPU 不断刷新的基准（benchmark），更对专用芯片（ASIC）领域不同场景下不断问世的解决方案表示出了空前的热情。

02

基于以太网MAC IP核的IEEE1588协议的设计与实现

为了满足网络设备对时间同步精度越来越高的要求，通过对IEEE 1588协议标准和当前以太网时间同步方案的研究，提出了一种采用FPGA硬件来实现时钟同步的方法。基于FPGA与ARM开发平台，自主设计实现了支持IEEE 1588标准的主从时钟同步系统，该系统具有成本低廉，移植性强的特点。通过在该平台上对千兆以太网环境中的时间精度进行测试，标记精度优于50ns。

04

Nano Transport：一种硬件实现的用于SmartNIC的低延迟、可编程传输层

摘要：传输协议可以在NIC(网卡)硬件中实现，以增加吞吐量、减少延迟并释放CPU周期。如果已知理想的传输协议，那么最佳的实现方法很简单：直接将它烧入到固定功能的硬件中。但是传输协议仍在发展，每年都有提出新的创新算法。最近的一项研究提出了Tonic，这是一种Verilog可编程硬件传输层。我们在这项工作的基础上提出了一种称为纳米传输层的新型可编程硬件传输层架构，该架构针对主导大型现代分布式数据中心应用中极低延迟的基于消息的 RPC（远程过程调用）进行了优化。Nano Transport使用P4语言进行编程，可以轻松修改硬件中的现有（或创建全新的）传输协议。我们识别常见事件和基本操作，允许流水化、模块化、可编程的流水线，包括分组、重组、超时和数据包生成，所有这些都由程序设计员来表达。

03

丛京生院士深度解读可定制计算的设计自动化：自动将代码转换成电路描述，解决开发人员最大难题

中国工程院、美国工程院双院院士丛京生教授在2020年北京召开的亚太地区设计自动化会议（ASP-DAC）上发表了关于可定制计算的演讲，指出可定制计算现在已经在各类公有、私有云上大面积铺开，并称已经做出了像Merlin编译器, HeteroCL, HeteroHalide等一系列的重大进展。（头图由ASP-DAC组委会和北京大学罗国杰教授提供。）

01

基于 FPGA 的低成本、低延时成像系统

《优秀的IC/FPGA开源项目》是新开的系列，旨在介绍单一项目，会比《优秀的 Verilog/FPGA开源项目》内容介绍更加详细，包括但不限于综合、上板测试等。两者相辅相成，互补互充~

01

FPGA Xilinx Zynq 系列（二十六）高层综合

今天给大侠带来FPGA Xilinx Zynq 系列第二十六篇，开启十四章，讲述高层综合等相关内容，本篇内容目录简介如下：

02

沉吟至今，生而为云：异构FPGA在云端一次算力的升华

本文介绍了异构计算在云计算领域的发展现状、技术挑战和应用前景，并分析了FPGA在云计算加速中的优势和挑战，同时探讨了FPGA在云服务中的具体应用案例。

03

用 TornadoVM 让 Java 性能更上一个台阶

在 QCon Plus 大会上，Juan Fumero 谈到了 TornadoVM，一种 Java 虚拟机（JVM）高性能计算平台。Java 开发人员可以通过它在 GPU、FPGA 或多核 CPU 上自动运行程序。

01

如何成为一名异构并行计算工程师

作者 | 刘文志责编 | 何永灿随着深度学习（人工智能）的火热，异构并行计算越来越受到业界的重视。从开始谈深度学习必谈GPU，到谈深度学习必谈计算力。计算力不但和具体的硬件有关，且和能够发挥硬件能力的人所拥有的水平（即异构并行计算能力）高低有关。一个简单的比喻是：两个芯片计算力分别是10T和 20T，某人的异构并行计算能力为0.8，他拿到了计算力为10T的芯片，而异构并行计算能力为0.4的人拿到了计算力为20T的芯片，而实际上最终结果两人可能相差不大。异构并行计算能力强的人能够更好地发挥硬件的能力，而

04

网络虚拟化技术：RDMA技术论文

分布式系统利用卸载来减少 CPU 负载变得越来越流行。远程直接内存访问 (RDMA) 卸载尤其变得流行。然而，RDMA 仍然需要 CPU 干预来处理超出简单远程内存访问范围的复杂卸载。因此，卸载潜力是有限的，基于 RDMA 的系统通常必须解决这些限制。我们提出了 RedN，这是一种原则性的、实用的方法，可以实现复杂的 RDMA 卸载，无需任何硬件修改。使用自修改 RDMA 链，我们将现有的 RDMA 动词接口提升为图灵完备的编程抽象集。我们探索使用商用 RDMA NIC 在卸载复杂性和性能方面的可能性。我们展示了如何将这些 RDMA 链集成到应用程序中，例如 Memcached 键值存储，从而使我们能够卸载复杂的任务，例如键查找。与使用单侧 RDMA 原语（例如 FaRM-KV）的最先进的 KV 设计以及传统的 RPC-over-RDMA 方法相比，RedN 可以将键值获取操作的延迟减少高达 2.6 倍。此外，与这些基准相比，RedN 提供性能隔离，并且在存在争用的情况下，可以将延迟减少高达 35 倍，同时为应用程序提供针对操作系统和进程崩溃的故障恢复能力。

04

高频交易：数学重要？还是技术重要？

各位读者，如果让你回答这个问题：高频交易：数学重要？还是技术重要？你觉得哪个重要呢？在这里。我们给大家普及一些涉及高频交易的专业术语：

03

百度公开硬件基准 DeepBench，推动深度学习专用芯片研发竞争

2016年10月18日，世界人工智能大会技术分论坛，特设“新智元智库院长圆桌会议”，重量级研究院院长 7 剑下天山，汇集了中国人工智能产学研三界最豪华院长阵容：美团技术学院院长刘江担任主持人，微软亚洲研究院常务副院长芮勇、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、联想集团副总裁黄莹、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。【新智元导读】百度开源 DeepBench 基准测试工具，AI研究者和芯片制造商可以用它测试不同的芯片运行软件时的性能，尤其是

06

FPGA国内”薪“赛道-在医疗领域的应用

从下游应用市场来看，通信和工业市场份额位居FPGA芯片一二位，同时通信市场份额有望持续提升。但是目前通信和工业市场趋于稳定，FPGA厂商一直推AI市场，但是AI市场目前被ASIC和显卡牢牢占据，FPGA被市场上认可度也不高。

01

FPGA ——从台前走向幕后

有这样一句话，“人生只有一次，FPGA却可以重写”。 FPGA，一个可以通过编程来改变内部结构的芯片。据调查报告显示，2021 年全球FPGA市场规模为 77.9 亿美元，预计未来将以 8.5% 的复合年增长率增长，到 2030 年全球FPGA市场规模将达到 162 亿美元。 FPGA的全称是Field Programmable Gate Array——现场可编程门阵列，是指一种通过软件手段更改、配置器件内部连接结构和逻辑单元，完成既定设计功能的数字集成电路。顾名思义，其内部的硬件资源都是一些呈阵列排列

02

赛灵思推出reVISION堆栈，进军广泛的视觉导向机器学习领域

机器之心原创作者：高静宜 2017 年 3 月 13 日，通过名为 reVISION™的堆栈，All programmable 技术和器件公司赛灵思（Xilinx）宣布将赛灵思技术扩展至广泛的视觉导向机器学习应用领域，解决软件及算法工程师 80% 的开发难题。机器学习近年来的快速发展促进了传统嵌入式视觉系统的变革，众多传统嵌入式视觉应用采用机器视觉和传感器融合技术后都在发生巨变。在 All programmable 技术和器件的全球领先企业赛灵思发布面向广泛视觉导向机器学习应用的名为 reVISION

09

为什么我们选择Java开发高频交易系统？

在高频交易领域，自动化应用程序每天需要处理数亿个市场交易信号，并在全球各交易所之间发送成千上万的订单。

02

深度学习的异构加速技术（三）：互联网巨头们“心水”这些 AI 计算平台

本文探讨了神经网络加速器在数据中心中的重要性，并提出了几种主要的神经网络加速器架构。这些架构包括基于GPU的架构、基于FPGA的架构和基于ASIC的架构。作者还讨论了这些架构的优缺点，并展望了未来神经网络加速器的发展方向。

04

2016年人工智能技术进展大盘点

如果说2015年大家还在质疑深度学习、人工智能，认为这是又一轮泡沫的开始，那么2016年可以说是人工智能全面影响人们生活的一年。从AlphaGo到无人驾驶，从美国大选到量子计算机，从小Ai预测“我是歌手”到马斯克的太空计划，每个焦点事件背后都与人工智能有联系。纵览2016年的人工智能技术，笔者的印象是实用化、智能化、芯片化、生态化，让所有人都触手可及。下面我们以时间为坐标，盘点这一年的技术进展。

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭