网站标志
自定模版

距离SZIEE 2024开幕还有:
---

展会新闻

联系我们

手机/Mobile:175 2121 9810
传真/Fax:021-8037 0384
E-mail:zwszexpo@126.com
http://www.csiee-expo.com



2024深圳嵌入式展览会(SZIEE 2024) > 从一款全新的嵌入式AI系统看未来DRAM的设计趋势

从一款全新的嵌入式AI系统看未来DRAM的设计趋势

最近,预测DRAM凛冬将至的声音不断,并且这种情况极有可能持续长达一年半之久。不过供不应求的市场现状并不影响华邦电子上半年的营收。

据华邦电子近日公布的数据,2021年上半年内存事业营收为新台币257亿1百万元,较去年同期增加36%,其中DRAM产品线占2021年上半年营收为46%, DRAM营收年增率近4成。闪存Flash产品线占2021年上半年营收为54%,Flash营收年增率超过3成。

据了解,华邦电子正在扩建产能,其中位于台湾高雄的新厂投产后,未来每年产出将以15~20%的产能幅度满足客户需求。除了产能方面的布局之外,华邦电子在产品技术方面的布局谋篇,同样具有代表性。

在近日的采访中,华邦电子DRAM产品营销部经理曾一峻介绍说:“在未来一两年,边缘计算将更流行。通常大家都认为AI的模型很大。但其实,行业内正在致力于通过不断的架构优化,来将AI模式缩小,可以说是在准确度可以接受的范围情况下进行极致地压缩化处理。

存储方案的设计趋势:外挂内存

在物联网、人工智能、5G、大数据、云计算等新兴技术的驱动下,最近几年,人们的生活品质呈现出明显的快速迭代。尤其是2020年的新冠疫情,及之后的后疫情时代,迅速拓宽和激活了我们全新的生活方式。短视频的崛起,让数据更是呈现指数级增长。这些海量的数据,传统的做法是上传至云端,运用人工智能技术,对数据进行云管理、云托管、云挖掘。不过,随着数据的激增,运算量实在太大,已经面临无法负荷的挑战。解决的办法就是把运算直接转移到终端或是边缘计算。

确实,在终端应用及边缘运算应用的驱动下,AI模型会一直往最佳化,也就是所谓的压缩化方向发展。纵观行业市场产品,不难发现这一趋势变化。如谷歌现在最有名的TensorFlow Lite for Micro Controllers,它可以把AI的神经模型引擎的Weight size压到很低。市面上还有厂商在做优化升级optimize,比如说MobileNetV2-YOLOv3-Nano,它的Weight size已经可以压到3.0MB,甚至Yolo-Fastest可以到1.3MB,Yolo-Fastest-XL也顶多3.5MB。

外挂内存是未来的设计趋势。当前,主芯片厂商在设计内存控制器时推崇的是HyperBus™技术。该技术最早是由Cypress在2014年发表。相较于其他内存IC的传输控制接口, HyperBus™ 接口的特点之一是接脚数低,这使得电路板的布局更简洁, 布线面积也更小。华邦电子因此趋势,也陆续推出相关的HyperRAM™ 系列产品。

据了解,华邦电子自2019年正式推出HyperRAM新型存储产品以来,在内存容量上,现在已经可以提供HyperRAM1.0、HyperRAM2.0、HyperRAM2.0e的系列产品。其中HyperRAM1.0的容量是 32Mb;HyperRAM2.0的容量是64Mb。256Mb HyperRAM 2.0/2.0e分別可支持x8 和x16,在3.0V或1.8V的工作电压之下,HyperRAM 2.0效能皆可达最高工作频率 200MHz,相当于数据传输率 400Mbps。

HyperRAM的关键技术

低功耗、引脚数少和易于设计是华邦电子HyperRAM的主要卖点。对于低功耗,其实对于内存产品来说,这是市场上对该类产品的一个主要诉求。华邦HyperRAM最大的一个亮点就是超低功耗。HyperRAM 2.0e的B/W约为1GB/s,运行功耗低于50微瓦,常温时待机功耗低于70微瓦,如果是超低功耗模式,常温时待机功耗低于35微瓦。

那么如此低的功耗,HyperRAM是如何做到的呢?原来,华邦是在电路上做了一些特别设计。HyperRAM在进入超低功耗模式时,就会关掉所有功耗电源,只保留一些必要性的电路,当然数据会一直被存储。相比传统的待机模式,这种超低功耗模式的唤醒时间势必会更长一些。不过,曾一峻表示,其实目前很多IoT的装置并没有那么多需要急于唤醒的时候,华邦经过与客户沟通发现,目前HyperRAM 超低功耗模式的的唤醒时间没有问题。

至于封装尺寸,HyperRAM的面积相比LPDDR与SDRAM都大大减小,更加易于设计。还有引脚数的部分,HyperRAM的引脚(pin count)很少,目前有两种类型, 8 I/O与16 I/O,16 I/O大概是30 Ball。相对传统LPSDRAM或者SDRAM都是50或60Ball,HyperRAM基本上减少将近一半的引脚数,即小于30个。所以在客户使用方面,不管是PCB 板的面积或者是设计来看,都会更加简单,也可以得到低功耗,频宽上面也没有太多的衰减,符合目前的市场需求。

HyperRAM的应用

曾一峻表示,从今年年底到明年开始,可能陆续会有很多导入HyperRAM的设计。如智能音箱、家用摄像头、智能门铃、智能门锁等智能家居应用,以及工业用人机界面,甚至汽车仪表。据介绍,目前在欧洲,已经有将HyperRAM应用于电动自行车的主机上的产品。

比如微控制器,可能需要搭载RTOS功能,或外挂一些WiFi/BT(Blue Tooth),或LTE,甚至还要添加设备端AI(On Device AI)的NPU功能。在添加AI功能的前提下,使用既有的SRAM存储RTOS之后,SRAM的空间就不够大了。而通常Microcontroller里面不会配置高容量的SRAM,因为成本太高。解决的办法就是采用外挂内存的处理方式。目前,虽然主流的智能设备如耳机、蓝牙(BlueTooth)、TWS等,基本采用的还全都是NOR Flash。不过随着衍生性应用需求的增多,为了实现更高阶的应用,就需要更大的内存来实现低延迟(low latency)、语音计算等功能。曾一峻介绍说:“外挂内存就是很好解决办法。这样的产品,可能明年开始就会出现在市场上。

图 音频/视频等MCU设备中的端上人工智能需求激增的应用与市场

除了在微控制器领域,华邦还在积极跟MCU以及一些系统厂商进行合作,希望将HyperRAM的生态系统建立起来。因为MCU系统的电路板不会做的很大,需要的引脚数(pin-count)不用太多,所以HyperRAM就是一个很好的选择。曾一峻介绍,目前很多microcontroller或者工业控制部分都希望导入华邦HyperRAM。尤其因为在低频(low frequency)的情况下,microcontroller其实并不需要特殊的DRAM去做控制,一般的GPIO在低时钟频率,如100MHz以下,就可以模拟出HyperRAM控制功能。所以对于microcontroller来讲非常适合采用HyperRAM产品

曾一峻进一步分享说:“HyperRAM可作为工作内存使用,适合AIoT设备的嵌入式AI和图像处理应用。华邦仍在持续对HyperRAM这个产品线做一些研发和企划。2.0e之后是2.0 Plus,这款产品速度将会再次得到大幅度提升。接下来,华邦会将HyperRAM的容量延伸到128Mb甚至256Mb,届时将可以存储更多图像数据或者更多AI模型。并且根据华邦的预期,未来这两三年AIoT的应用会越来越广泛。我们希望在市场的回响越来越好之后,将推出HyperRAM3.0。”

华邦HyperRAM计划

NOR+NAND,全面提升AI“读取速度”

因为目前AI大多将数据存放在终端进行运算,也会有一些AI模型需要存放在终端,通常都是存放在NOR Flash或者是NAND Flash上面。使用情境就是把AI模型快速的从闪存读取出,再传到DRAM/SDRAM 或者HyperRAM做一些运算。所以, “读取速度”成为了很重要的考量点。

华邦SpiStack :NOR芯片和NAND芯片堆叠封装

华邦SpiStack将NOR芯片和NAND芯片堆叠到一个封装中,例如 64Mb Serial NOR和1Gb QspiNAND芯片堆叠,使设计人员可以灵活地将代码存储在 NOR 芯片中,并将数据存储在NAND芯片。此外,虽然是两个芯片 (NOR+NAND) 的堆栈,但单一封装的SpiStack,在使用上仅需6个信号引脚

两颗芯片变一颗芯片,PCB拉线才会变小

总结来看,华邦的SpiStack拥有三大优点,即硬件兼容、成本优势、质量优良。对于闪存产品,客户永远都会期待它拥有以下三个优点,PCB占地小、成本低、组合多样化。而华邦的SpiStack产品家族可以充分满足这些需求。

  • 首先,华邦通过把两颗不同的SpiNOR与SpiNAND,采用标准型封装为一个闪存产品。原本的NOR是八只脚的标准封装,原本的NAND也是八只脚的标准封装,放在一起之后,它还是八只脚的标准封装,所以在硬件设备上或者是拉线设计,甚至电路板设计上,不需要做任何的更改。因为华邦的SpiStack封装是标准型,而不是特规型的封装。此外,SpiStack的管脚也与原本的标准型封装完全对应,所以在硬件兼容方面,采用华邦SpiStack产品,使用者无需重新进行电路板设计。
  • 第二个,消费型的电子产品售价不可以太高,所以这就要求各个零件的成本都需要降低。而成本与PCB设计息息相关。PCB电路板面积越大,所要耗费的成本就越高。华邦SpiStack产品可以把一颗NOR Flash加上一颗NAND Flash堆叠起来,使得原本要用两颗闪存的占地面积变成一颗闪存,这样就可以缩减电路板的面积,也可以缩减原本使用者缩减闪存成本。电路板上的拉线也从原本两颗的拉线变成只需要一颗的拉线,能够进一步节省电路板的面积。
  • 第三个, 目前华邦SpiStack产品线的产品型号W25M161AVEIT、W25M321AVEIT、W25M641AVEIT、W25M121AVEIT,分别是16Mb、32Mb、64Mb、128Mb的NOR Flash搭配上1Gb NAND。此外,客户也可以选择其他种不同容量的NOR搭配不同容量的NAND。客户的考量需求有两个, 一个主要是根据开机数据量的大小,另一个是考量到需要存放较大的数据,比如说是图片数据或是程序数据。客户可以就这两个考量来决定所需要NAND Flash和NOR Flash的容量大小。用户或系统设计者,将不会浪费太多成本去使用超过需求容量的闪存。

用户案例:瑞萨的RZ/A2M

7月初,华邦电子正式确认,华邦HyperRAM 和 SpiStack (NOR+NAND) 产品将与瑞萨基于Arm 内核的RZ/A2M 微处理器 (MPU) 搭配使用。瑞萨RZ/A2M属于RZ产品系列微处理器,基本适用于所有需要图像预处理的应用,尤其在非汽车的产品当中属于性能卓越的系列。

瑞萨 RZ/A2M硬件结构框图

RZ/A2M的基础是ARM Cortex-A9 528MHz MPU。和其他的MPU一样,有一些共通的外设。但是比较特殊的是RZ/A2M同时设置有两个网口,两个USB,两个SDHI,还有一些security在里面。此外还有三个比较特别的与其他品牌MPU不同的地方,RZ/A2M配置了瑞萨独有的DRP硬件加速内核,主要用于图像预处理,速度非常快。

据了解,DRP是一个硬件加速,即搭载外置memory的图像预处理应用。它是瑞萨自研加速核,可以比一般的CPU快10倍左右。以二维码扫描仪为例, 单纯用一款528MHz的芯片,便能达到60帧输出,基本等同于其他客户用的FPGA级别。

那为什么RZ/A2M还要采用华邦的HyperRAM呢?

面对这个问题,瑞萨电子中国企业基础设施事业部经理 Anson介绍说,音频/视频等MCU设备中的人工智能需求激增,是促使瑞萨等企业选用HyperRAM产品的主要原因。据了解,RZ/A2M内部配有一个4MB的SRAM,可用于比较简单的应用,如一些HMI(人机交互界面),或者是简单的控制应用。因为本身配备DRP的核,即使CPU运转不快, 仍然可以用于图像预处理。但是面对现在很多的嵌入式系统,数据量以及程序库依然远远大于普通的HMI。4MB的内存容量,面向现在嵌入式AI系统来讲,有些应用场合是不够的。所以很多时候瑞萨都会建议客户采用外挂内存。

瑞萨RZ/A2M采用华邦的HyperRAM和SpiStack (NOR+NAND)可以减少PCB上的内存安装面积、导线数量和BOM成本。两种封装尺寸均仅有8x6mm , 其中有13个信号引脚用于HyperRAM,6个用于SpiStack (NOR+NAND)。与传统的SDRAM和并行NOR/NAND相比,华邦HyperRAM和SpiStack的封装尺寸和终端数量都减少了80%左右。随着嵌入式AI系统变得越来越复杂,使用搭载外部存储器的RZ/A2M可支持应用程序代码或训练模型不断增加的数据量。

深圳会展中心(福田)

131 2781 8947

zwszexpo@126.com

Copyright © 版权所有 2024中国(深圳)国际嵌入式展览会