华睿2号数字信号处理器
近日,中国电科14所耗时4年设计的华睿2号数字信号处理器(DSP)顺利通过中国 “十二五”核高基重大专项芯片的验收。华睿2号则采用8核架构,加上基频提高一倍而达到1GHz,使指令周期提高6倍而达到每秒4000亿次浮点运算(400GFLOPS)。
从数据上看,华睿2号的性能已经超越了美国的主流DSP芯片。14所是我国歼-20战机有源相控阵雷达、预警机雷达、中华神盾雷达、反隐身雷达、反导预警雷达的研制单位,华睿2号芯片性能强劲当然是我国重大武器装备自主化的福音。那么DSP芯片究竟是什么?华睿2号出现后我们就高枕无忧么?今天,北国防务就来说说这事。
自从雷达数字化革命以来,其主要核心就是由前端的信号处理器与后端的数据处理器所组成。所谓的 “数据处理器”其实与计算机CPU类似,负责数据的处理与逻辑分析工作,例如计算目标的坐标、记忆/追踪目标位置、综合敌我识别器与雷达的情报提供给显示处理器等等。在商用计算机市场成熟后,常选择民用CPU来定制成军用产品。但由于信号处理的专门性,往往需要针对武器的特性设计专门的芯片,也就是所谓的 “专用芯片”(ASIC)。
随着芯片技术的进步,民间也开始有信号运算的需求,例如科学研究、数据分析等等,尤其是通讯产品更是有强大需求。因此开始有厂商制作通用型的数字信号处理器(DSP),也就是将常用的信号运算功能都整合在一个芯片中,客户透过函数库进行自己的运算。
理论上,通用型DSP的运算效能比不上专用的ASIC,可现实情况是民间对芯片的需求量远大于军方订单,而民用产品的研发节奏也远快于军方项目,因此通用型DSP的指令周期很快就提升上去,将军方专用的ASIC抛到后头。
对军用ASIC而言,雪上加霜的是随着芯片制程的尺度越来越小,开发一颗芯片的设计与光罩成本越来越高,以军方只有几百到几万颗芯片的订单根本连下给晶圆厂都排不到产能。因此军方开始向民间订购商用芯片,但要强化到满足严苛的环境标准,这种产品就称为 “商用现货”(COTS)。
例如F-35就大量使用COTS电子元器件,在原型机阶段是由国防厂商雷神公司向Mercury公司采购RACE++系列计算机,内含的1.06GHz的MPC7448是基于PowerPC e600架构结合Altivec 128位浮点运算技术而成的DSP,总和指令周期达75.6GFLOPS,为F-22全部信号处理器的3.5倍。美国DSP市场领导者德州仪器公司的顶尖产品:C66x系列则是单核速度19.2GFLOPS,8核总和为153.6GFLOPS,而华睿2号的指令周期高达400GFLOPS,可说是将美国DSP都抛到后头了。
那么DSP芯片领先美国是不是就可以高枕无忧了呢?当然不是,其实美国DSP不只是被华睿2号抛在后头,而是在近十年内都被另外两种商用芯片抛到了后头,即“通用计算图形处理器”(GPGPU)和“现场可编程门阵列”(FPGA)。
GPGPU为游戏画面而生,迅速成长为运算巨兽,其浮点指令周期早已突破“兆次运算”大关,并向十兆以上迈进,完全把DSP踩在脚下。但功耗较高及延迟时间较短长,因此被限制在大型飞机、舰船、地面站台等不缺冷却与供电的平台上,DSP仍可把持战机、无人机、导弹、个人装备。。。等对于供电与冷却供给要求高的小型平台市场。
但功耗较高以及延迟时间较短长,因此被限制在大型飞机、舰船、地面站台等不缺冷却与供电的平台上,而DSP仍可把持战机、无人机、导弹、个人装备。。。等对于供电与冷却供给高度紧绷的小型平台市场。
在信号处理的市场,FPGA的指令周期可逼近GPGPU,但功耗却是接近DSP的水平,上至潜艇声纳信号处理系统,下至无人机的微型雷达,都可用FPGA芯片来满足信号处理的需求。美国洛马公司在2013年就为F-35订购了83169颗FPGA芯片,写入不同的逻辑电路后可满足F-35众多射频与光电系统的庞大信号处理需求。
在GPGPU与FPGA的两大强敌夹杀下,美国的DSP军用市场逐渐萎缩。这是美国的DSP芯片让华睿2号后来居上的一大原因,当然传统DSP架构还是有软件定制化成本较低的优点,在进一步压榨出运算效能后还是能满足对雷达、电子战。。。等信号处理的需求。
只是美国作为芯片产业的发源地,其软硬件生态圈既深又广,破坏性创新的能力仍是无人可及,即便DSP技术出现落后,仍可用GPGPU与FPGA的颠覆性优势扳回一城。
因此,华睿2号出现当然是一项重大成就,有了它我国的众多国之重器都可以不受国外限制。但我们还要看到当前芯片领域的新动向,意识到差距奋起直追才能保证不落后。