FPGA算法映射要点

代码之神 2019-06-26

将图像处理的算法转换为FPGA系统设计的过程称为算法映射，CPU并行算法的实现与FPGA并行算法的实现是有一定区别的。
FPGA算法映射要点

1.算法系统结构

图像处理算法主要有两种设计结构：流水线结构和并行阵列结构。

1.1 流水线结构

在我看来，流水线结构和我们之前所理解的CPU的串行结构还是有一定区别的。相反，它与处理器的流水线结构很相似，都是依照时钟来进行流水层级的同步。
FPGA算法映射要点

1.2并行阵列结构

|--Data1--->Data1-->Data1
            |
InputData------Data2--->Data2-->Data2
            |
            |--Data3--->Data3-->Data3

2.算法转换

2.1 定常数转换

对于FPGA而言，做加法与移位较为简单，而涉及到乘法与除法时需要调用到乘法器或除法器，这在FPGA中是较为宝贵的资源，所以作为定常数，我们尽量转换为移位和加法运算，如：

ex1:
        dout = din * 255
转换后
        dout = ( din << 8 ) - din

ex2:
        dout = din * 11
转换后：
        dout = din * 2^2 + din * 2^3 - din * 2^0
             = din * (2^2 + 2^3 - 2^0)

上式中的255 和 11就是定常数

2.2 不等式等效转换

进行转换的目的也是为了在FPGA实现后能够更加节省资源。如：

ex1:
        √a￣  < b, a > 0
转换后：
        b^2 > a

ex2:
        a/b > c/b (b > 0, d > 0)
转换后
        a * d > b * c

2.3 取近似值

最简单的近似值莫过于四舍五入，假如某数据D[-1~4]为整数部分，D[3~0]为小数部分，那么四舍五入可为:

assign dout = din[3]?(dout[-1~4] + 1) : (dout[-1~4])

泰勒公式定义
FPGA算法映射要点
那么就可以有如下近似转换：

1/3 = 1/4 * (1 + 1/4 + 1/16 + 1/64 + 1/256)

3.构造查找表

查找表是使用简单的查询操作代替运行时的实时计算，使用查找表代替那些运行时经常需要用到的运算能够极大的减少时间复杂度，如我们经常用到的三角函数就应该使用查找表替换实时计算。

原文地址 coderdock.com

: 代码之神

相关推荐

GPU相比FPGA更具优势，适应AI快速变化需求

　　他表示称目前做好一个 FPGA，整个编程时间就要几个月，而且还要在硬件层面对它进行编程。然而现在 AI 变化速度非常快，甚至更新是以分钟来计算的，所以必须要在软件端实现高度灵活的可编程。恰恰 GPU 是 AI 领域的专用芯片，他的指令集是非常有优势的，

xcznb 0喜欢 / 0评论 2019-12-29

赛灵思-5G和人工智能时代的赢家

网易智能 0喜欢 / 0评论 2019-10-28

嵌入式：一文看懂ASIC和FPGA的区别

FPGA流派的代表公司如Xilinx主推的Zynq平台，而ASIC流派的代表公司有Movidius。两大流派各有长短，下面让小编来细细分说。FPGA上市速度快，但性能较低。由于移动终端属于消费电子领域，所以未来使用的方案应当是以ASIC为主。

qwerrr 0喜欢 / 0评论 2017-07-13

FPGA加速：面向数据中心和云服务的探索和实践

欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~为了进一步加速云计算的创新发展、建立云计算信任体系、规范云计算行业、促进市场发展、提升产业技术和服务水平，由中国信息通信研究院、中国通信标准化协会主办的“2018可信云大会”于2018年8月14日－

Ezenwang 0喜欢 / 0评论 2019-06-28

西安交大获DAC19系统设计竞赛FPGA赛道亚军，这是他们的设计方案

近日，第二届「低功耗目标检测系统设计挑战赛」落下帷幕。来自西安交通大学人工智能与机器人研究所的队伍 XJTU-Tripler 获得本次比赛的亚军。本文将介绍这支队伍的设计解决方案。2019 年 6 月 5 日，由自动化设计顶级会议 Design Autom

zhuhong 0喜欢 / 0评论 2019-06-24

如何将FPGA资源平民化？阿里工程师有了新突破

今天我们很高兴地宣布：新晋的大规格FPGA实例，基于Xilinx 16nm Virtex UltraScale+ 器件VU9P的异构计算实例F3在阿里云上线了！我们借此机会，对阿里云FPGA计算服务本身，以及这次发布的F3实例的底层硬件架构和平台架构做一个

touchfuture 0喜欢 / 0评论 2019-06-27

【F3使用场景】F3经典使用场景

人工智能深度学习客户，推理应用最近两年，人工智能在全球掀起了巨大的应用热潮，除了互联网巨头，如Google，Facebook，Alibaba之外，涌现出众多的Start up公司，也都逐渐成为行业翘楚。可是F3在人工智能大规模商业部署中，具备独特的性能优势

九品神元师 0喜欢 / 0评论 2019-06-27

【F3使用场景】F3经典使用场景

人工智能深度学习客户，推理应用最近两年，人工智能在全球掀起了巨大的应用热潮，除了互联网巨头，如Google，Facebook，Alibaba之外，涌现出众多的Start up公司，也都逐渐成为行业翘楚。可是F3在人工智能大规模商业部署中，具备独特的性能优势

九品神元师 0喜欢 / 0评论 2019-06-27

3天上手，30天精通！——深度学习FPGA加速器设计

本文的目标是帮助对于深度学习硬件加速器设计感兴趣的朋友快速上手基于 FPGA 的深度学习加速器设计。计算机体系结构知识：参考书《计算机组成与设计》，不需要熟读全书，但要对一些加速器设计相关的基础概念有比较清晰的理解和认识，如流水线、数据并行等。我们选取卷积

mingzheng 0喜欢 / 0评论 2019-06-03

何为真正的 FaaS？阿里舜天平台做了四大创新

以及在阿里，我们如何做到真正的 Faas？Gartner 于4月24日发布报告，阿里云以19.6%的市场份额，雄踞整个亚太第一，AWS 和微软分居第二和第三。全球范围内，仍然维持了AWS、微软和阿里云分别为冠、亚、季军的格局。

Zjzk 0喜欢 / 0评论 2019-06-03

UIUC推出最新DNN/FPGA协同设计方案，助力物联网终端设备AI应用

UIUC、IBM 和 Inspirit IoT, Inc的研究人员提出 DNN 和 FPGA 加速器的协同设计方案，通过首创的「Auto-DNN」网络搜索引擎 +「Auto-HLS」加速器生成技术，自动生成适用于终端设备的 DNN 模型及 FPGA 加速器

zhuhong 0喜欢 / 0评论 2019-05-28

深度学习中，CPU、GPU、NPU、FPGA如何发挥优势

随着AI的广泛应用，深度学习已成为当前AI研究和运用的主流方式。面对海量数据的并行运算，AI对于算力的要求不断提升，对硬件的运算速度及功耗提出了更高的要求。目前，除通用CPU外，作为硬件加速的GPU、NPU、FPGA等一些芯片处理器在深度学习的不同应用中发

flyfish 0喜欢 / 0评论 2019-05-10

英特尔推出新一代Stratix 10 FPGA加速卡：性能提升3倍

去年 10 月，英特尔发布了面向服务器的 FPGA 计算卡 Arria 10，并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年，我们就看到了 Arria 的继任者。9 月 26 日，这家芯片科技巨头宣布推出 Stratix 10 SX FP

xinxuan 0喜欢 / 0评论 2018-09-28

AI 算法在 FPGA 芯片上还有这种操作？

AI算法的崛起并非一帆风顺的，现在的主流的NN类的卷积神经网络已经是第二波浪潮了，早在上个世纪80年代，源于仿生学，后又发展于概率学的早期AI算法已经取得了重大的进展，到1986年Rumelhart等人提出多层网络的反向传播算法后，第一波AI算法以“连接主

troysps 0喜欢 / 0评论 2019-04-22

全新起点！英特尔发布Agilex FPGA，采用10纳米制程 | 极客头条

四月，草长莺飞、桃花烂漫。如此茂盛的季节，给科技行业的新品推出，更加增添了几分喜气。4月3日，英特尔宣布推出全新产品家族——英特尔 Agilex FPGA。随后，英特尔中国研究院院长宋继强、英特尔亚太研发有限公司总经理卢炬和英特尔子公司Mobileye大中

王基 0喜欢 / 0评论 2019-04-04

时间序列数据库(HiTSDB)压缩算法的FPGA加速

HiTSDB 提供百万级时序数据秒级写入，高压缩比低成本存储、预降精度、插值、多维聚合计算，查询结果可视化功能；解决由于设备采集点数量巨大，数据采集频率高，造成的存储成本高，写入和查询分析效率低的问题。

NeoStudio 0喜欢 / 0评论 2017-11-30

微软推出深度学习加速平台脑波计划：FPGA驱动实时人工智能

近日在 Hot Chips 2017 上，微软团队推出了一个新的深度学习加速平台，其代号为脑波计划，机器之心将简要介绍该计划。脑波计划在深度学习模型云服务方面实现了性能与灵活性的巨大提升。微软专为实时人工智能设计了该系统，它可以超低延迟地处理接收到的请求。

樱花落瓣 0喜欢 / 0评论 2017-08-23

专访阿里云专家：异构计算，GPU、FPGA、ASIC芯片将三分天下

编者按：10月11-14日，为期四天的2017杭州云栖大会（门票火热抢购中！）将再度在杭州云栖小镇起航，作为全球最具影响力的科技展会之一，本届大会将有不少阿里集团专家以及各企业行业领袖的精彩演讲。今天，我们采访的是阿里云虚拟化平台负责人张献涛，他将在10月

pengfeibeiming 0喜欢 / 0评论 2017-09-12

深度学习硬件对比评测：英特尔FPGA和英伟达GPU哪个更好？

FPGA 会随着深度学习的发展占领 GPU 的市场吗？英特尔的研究人员对目前最好的两种芯片做了对比。数据分析经常依赖于机器学习算法。在众多机器学习算法中，深度卷积神经网络在重要的图像分类任务中具有当前最高的精确度，因而被广泛采用。采用比 32 位更少的紧密

qinrui 0喜欢 / 0评论 2017-03-24

FPGA 2017最佳论文：深鉴科技ESE语音识别引擎获奖

FPGA 芯片领域顶级会议 FPGA 2017 于 2 月 24 日在加州 Monterey 结束。在本次大会上，斯坦福大学在读 PhD、深鉴科技联合创始人韩松等作者的论文 ESE: Efficient Speech Recognition Engine

GBAEagle 0喜欢 / 0评论 2017-02-25

赛灵思新CEO首秀 FPGA杀入重围，将与英伟达英特尔展开AI芯片大战

在发布了以数据中心优先、加速主流市场的增长和驱动灵活应变的计算三大战略之后，Victor同时宣布正式推出ACAP。日前，赛灵思在北京召开新闻发布会，新任CEO Victor Peng首次在北京公开露面并接受媒体采访。据赛灵思介绍，ACAP是一个高度集成的多

静 0喜欢 / 0评论 2018-03-20

Hadoop尚能饭否？发布新版本支持GPU和FPGA

近日，Apache Hadoop发布了3.1.0版本，这是2018年Hadoop 3.x系列的第一个小版本，较之前的Hadoop 3.0有了一些重大改变，因为它终于支持GPU和FPGA了。但这个版本还不适用于生产环境，如需要在生产环境下使用的用户，还需等待

zhouxucando 0喜欢 / 0评论 2018-04-08

英特尔全球最大的FPGA创新中心落户重庆

人工智能对算力的需求吸引了众多公司研发AI芯片，但仅靠一种芯片难以满足AI需求，因此，无论是传统架构的芯片还是类脑芯片都在抢占市场。作为CPU的霸主，英特尔不仅没有缺席AI的竞争，还通过创新和并购不断增强自己的实力。在2015年以167亿美元收购全球第二大

xzqxiaoqing 0喜欢 / 0评论 2018-12-25

打破AI算力瓶颈的，是基于FPGA的异构计算加速平台解决方案

近日，杭州加速云信息技术有限公司加速云创始人兼CEO邬刚在新品发布会上表示：“人工智能未来发展存在瓶颈，需要硬件技术和算法方面的突破。异构计算是计算架构的未来趋势，而FPGA 是实现异构计算的完美选择。”然而深度学习需要大量的并行计算，对硬件平台有极高的要

EastCarFxxBlog 0喜欢 / 0评论 2018-05-08

FPGA学习笔记（三）——Verilog基本语法

memory型数据常用于寄存器文件、ROM和RAM建模等，是寄存器型的二维数组形式，它是将reg型变量进行地址扩展而得到。reg[n- : ] 存储器名[N- : ];

人丑就该多读书 0喜欢 / 0评论 2018-05-19

DSP/FPGA——DSP与FPGA的供电问题

最近在使用FPGA与DSP，在设计其硬件和编写程序时，遇到了其供电电压有多个的问题，网上经验参考和自己的理解如下：。这个电源的电流需求一般都不大，但对电源的噪声容忍度很低。所以应该尽可能的提高其电源纯净度。另外Vccaux还给部分的I/O供电,比如功能选择

扑克投资家 0喜欢 / 0评论 2018-04-13

基于FMC接口的FPGA信号处理PCIE数据传输载板

PCIE701是北京青翼科技的一款基于PCI Express总线架构的高性能数据预处理FMC载板，板卡具有1个FMC接口，1个X8 PCIe主机接口，板卡采用Xilinx的高性能Kintex-7系列FPGA作为实时处理器，实现FMC接口数据的采集、处理、以

迷思 0喜欢 / 0评论 2018-04-09

FPGA笔试必会知识点1--数字电路基本知识

FPGA笔试必会知识点1--数字电路基本知识组合逻辑与时序逻辑组合逻辑电路：任意时刻电路输出的逻辑状态仅仅取决于当时输入的逻辑状态，而与电路过去的工作状态无关。在电路的结构上，时序逻辑电路肯定包含有存储电路，而且输出一定与存储电路的状态有关。TTL接到CM

ScalersTalk成长会 0喜欢 / 0评论 2018-04-07

基于Xilinx FPGA的视频图像采集系统

本篇要分享的是基于Xilinx FPGA的视频图像采集系统，使用摄像头采集图像数据，并没有用到SDRAM/DDR。当然这只是一个基础，博主日后也会着手去深入学习基于FPGA的摄像头的驱动。这是本系统简单的结构框图，主要有摄像头配置模块、图像数据采集模块、像

清醒疯子 0喜欢 / 0评论 2018-01-22

FPGA基础知识8(FPGA静态时序分析)

任何学FPGA的人都跑不掉的一个问题就是进行静态时序分析。静态时序分析的公式，老实说很晦涩，而且总能看到不同的版本，内容又不那么一致，为了彻底解决这个问题，我研究了一天，终于找到了一种很简单的解读办法，可以看透它的本质，而且不需要再记复杂的公式了。我们的分

量子世界 0喜欢 / 0评论 2017-12-23

FPGA中的“门”

在ASIC的世界里，衡量器件容量的常用标准是等效门。这是因为不同的厂商在单元库里提供了不同的功能模块，而每个功能模块的实现都要求不同数量的晶体管。这样在两个器件之间比较容量和复杂度就很困难。解决的办法是给每个功能赋予一个等效门数值，就比如“A功能模块等价

语感 0喜欢 / 0评论 2017-12-20

FPGA基础知识（四）锁存器、触发器、寄存器和缓冲器的区别

锁存器不同于触发器，它不在锁存数据时，输出端的信号随输入信号变化，就像信号通过一个缓冲器一样；一旦锁存信号起锁存作用，则数据被锁住，输入信号不起作用。锁存器也称为透明锁存器，指的是不锁存时输出对于输入是透明的。在某些运算器电路中有时采用锁存器作为数据暂存器

软件设计 0喜欢 / 0评论 2017-06-26

数字电路设计中DSP和FPGA的比较与选择

DSP+FPGA结构的新思想的出现以及嵌入DSP模块的FPGA设计方案使得数字电路设计有了更大的选择空间。

80652319 0喜欢 / 0评论 2017-06-10