在使用CNN算法的云数据中心,Altera FPGA实现的加速功能具有优异的每瓦性能

时间:2022-03-16来源:佚名

Altera公司(NASDAQ: ALTR)今天宣布,微软(NASDAQ: MSFT)采用Altera Arria® 10 FPGA (现场可编程门阵列)实现基于CNN (卷积神经网络)算法的数据中心加速功能,其每瓦性能非常优异。这些算法通常用于图像分类、图像识别,以及自然语言处理等。

微软研究人员在云技术上不断取得进展,采用Arria 10开发套件和Arria 10 FPGA工程样片,展示了每瓦40 GFLOPS的性能——数据中心业界最好的性能水平。而且,与GPGPU相比,在CNN平台上,这一FPGA的性能功耗比是CNN的3倍。之所以能够达到这一性能水平,是由于采用了开放软件开发语言OpenCL,以及VHDL对Arria 10 FPGA及其IEEE754硬核浮点DSP (数字信号处理)模块进行编程。

微软研究院客户和云应用总监Doug Burger评论说:“我们看到,采用了Arria 10工程样片后,CNN性能和功效大幅度提升,硅片中DSP模块的高精度硬核浮点功能是我们取得令人注目的研究成果的主要原因。”在微软的一篇博客文章中,http://bit.ly/1MMMzvG,Burger介绍了数据中心在基础设施上遇到的难题,以及微软是怎样通过采用可编程FPGA替代传统CPU来解决这些难题的。

Altera计算和存储业务部总监Michael Strickland说:“FPGA在神经算法上有体系结构方面的优势,能够非常高效的进行卷积和汇集,其灵活的数据通路支持大量的OpenCL内核直接互相传送数据,而不需要使用外部存储器。Arria 10在体系结构上还有更多的优势,乘法和加法都支持硬核浮点——这种硬核浮点功能在逻辑数量和时钟速度上要优于传统的FPGA产品。”

Altera曾宣布微软使用其Stratix V FPGA在创新的Catapult电路板上加速进行搜索,这类电路板于去年年底部署在第一个必应数据中心的服务器中。

相关评论

具有硬核浮点DSP功能的Altera 20 nm FPGA展示了业界最好的性能和功效水平

很多公司使用具有内置硬核浮点DSP功能的Altera Arria® 10 FPGA产品获得了令人瞩目的每瓦性能。Altera与客户和合作伙伴在解决方案上密切协作,实现高性能计算(HPC)、数据中心加速,以及金融系统。

微软——Doug Burger,客户和云应用总监

微软研究院客户和云应用总监Doug Burger评论说:“我们看到,采用了Arria 10工程样片后,CNN性能和功效大幅度提升,硅片中DSP模块的高精度硬核浮点功能是我们取得令人注目的研究成果的主要原因。”微软的一篇博客文章,http://bit.ly/1MMMzvG

Bittware——Jeff Milrod,总裁兼CEO,Bittware

Bittware总裁兼CEO Jeff Milrod评论说:“Altera的Arria 10真正的改变了游戏规则。利用这些器件中的自然浮点引擎,系统设计人员能够非常方便、高效的使用FPGA中大量的浮点资源。传统的信号处理应用现在可以直接连接Arria 10模拟信号,以浮点方式处理它们。对于HPC和加速应用,再也不需要将FPGA算法导出至定点,也不用对浮点进行低效的定点仿真来实现。Arria 10自然的浮点功能性能高达40 GFLOPS/W,而且Fmax更高,只使用了三分之一的逻辑资源。与以前任何其他的解决方案相比,它使用方便,功耗低,速度快,占用的资源更少。”

Gidel——Reuven Weintraub,创始人兼CTO,Gidel

Gidel创始人兼CTO Reuven Weintraub评论说:“我们对于Altera Arria 10前所未有的单位功耗触发性能非常感兴趣。长期以来,FPGA在比特、字节和整数处理方面的单位功耗性能非常优秀。Altera Arria 10强大的单位功耗浮点性能为Gidel产品开辟了新天地,非常适合很多HPC和DSP应用。”

Nallatech——Allan Cantle,总裁,创始人,Nallatech

Nallatech总裁、创始人Allan Cantle评论说:“Nallatech移植了我们客户的产品代码,这需要使用Altera OpenCL编译器的浮点数学功能。把这些功能在具有专用浮点DSP的新Arria 10 FPGA中实现,我们减少了对逻辑资源的占用,而且提高了时钟频率,进一步提高了每瓦性能指标,使得Nallatech新的基于Arria 10的加速器在更多的应用领域中脱颖而出。”

ReFLEX CES——Yann Casteignau,首席工程师,ReFLEX CES

ReFLEX CES首席工程师Yann Casteignau评论说:“ReFLEX CES最近发布了基于Altera Arria10 FPGA的FPGA电路板,这主要受益于这一第10代FPGA系列中新的浮点DSP模块。我们的目标是帮助客户大幅度提高GFLOPS/W比(预期有三倍),同时,减少实现复数浮点计算所需要的逻辑资源,为客户实现自己的设计留有更大的空间。我们很多客户在高性能计算中都使用了ReFLEX CES电路板,功耗是他们面临的主要难题。采用Arria10 FPGA,不但降低了功耗,而且计算性能更好。对于ReFLEX CES电路板,Arria10新的硬核DSP浮点运算是决定性的优势,提高了性能,减少了所使用的逻辑资源,优化了GFLOPS/W比。”

Altera简介

Altera®的可编程解决方案帮助电子系统设计人员快速高效地实现创新,突出产品优势,赢得市场竞争。Altera提供FPGA、SoC、CPLD,以及电源管理等互补技术,为全世界的客户提供高价值解决方案。

    相关阅读

    城市亮化工程如何设计才能具有层次感?

    城市亮化工程 的主要目地是为夜间带来一体化照明,考虑基础的视觉识别规定,自然环境照明的光层级与光线总数的多少相关,假如空间中的自然环境照明比工作照明低许多 ,在工作...
    2022-10-11
    城市亮化工程如何设计才能具有层次感?

    城市道路照明工程主要有哪些?

    在城市建设中,道路照明 是必不可少的基础设施,也是城市夜景的重要组成部分。在某种程度上,它还反映了城市的经济实力,社会进步和现代化的标志。它为夜间在城市中的车辆和行...
    2022-07-12
    城市道路照明工程主要有哪些?

    安全出口指示标志灯为什么是绿色而不是红色?

    对于安全出口指示标志灯相信大家都不陌生,我们在日常生活中在任何公众场所的紧急疏散的安全出口都可以看到这个安全出口指示标志灯,大家有没有想过安全出口的指示标志为什么...
    2022-05-21
    安全出口指示标志灯为什么是绿色而不是红色?

    路灯照明合理的布置方式

    路灯的布置方式主要有单侧布置、双侧交错布置、双侧对称布置、中心对称布置、横向悬索布置五种形式,随着城市道路的不断拓宽,平交路口转弯半径越来越大,根据《城市道路亮化...
    2022-07-15

    泛光照明工程是什么?应用范围有哪些?

    很多人提及 泛光照明工程 会有一些生疏,不理解泛光照明包含哪些,也不知道 泛光照明工程 跟普通照明工程有哪些不一样。 实际上泛光照明工程便是归属于城市景观照明工程或环境...
    2022-10-17
    泛光照明工程是什么?应用范围有哪些?

    消防应急灯的寿命有多长?一般可以使用多长时间?

    对于消防应急灯的使用寿命相信很多人都想了解这个问题,因为消防应急灯安装了就不需要时时刻刻盯着,这需要定时检查就可以了,但是很多人都不知道消防应急灯的寿命有多长,不...
    2022-05-21
    消防应急灯的寿命有多长?一般可以使用多长时间?

    快投派智能无线投屏器,让无线互联更加简单便捷

    没有WiFi的情况下可以进行无线投屏吗? 长期使用投屏功能的人,或多或少都知道自己的手机可以通过【无线投屏】【屏幕镜像】功能,直接连接到智能电视或无线投屏器,下意识地认...
    2022-05-11
    快投派智能无线投屏器,让无线互联更加简单便捷

    广场照明的设计技巧

    广场照明设计 主要包括休闲广场、集会活动广场、商业广场的照明设计。 1)休闲广场。主要是为人们提供休息、社交和举行小型文化娱乐活动的地方,由于人们活动方式不同,有些区...
    2022-07-15

    网站栏目