一、计算机运算控制的核心——CPU
/ L: Y. k5 a1 s7 ]/ C& d5 r
9 W8 x, {6 k1 c7 Z9 `7 x- t CPU(Central Processing Unit,中央处理器)是计算机的核心,负责运算和控制。它是一种集成电路芯片,负责执行指令、控制操作和协调计算机的各种活动,是计算机运行和运算能力的关键组件之一。因此CPU也被称为计算机的大脑。6 l& w% J a' T+ o% X8 ` M3 n: X
8 t9 c5 P/ N9 k- }+ L CPU的工作原理可以分为五个阶段:取指令、指令译码、执行指令、访存取数和结果写回。一般程序是CPU从存储器或高速缓存中逐条取出指令,并存放到指令寄存器中进行译码。然后按照指令的要求执行操作,直到程序执行完毕。CPU由控制单元、运算单元和存储单元三部分组成,并通过内部总线连接。控制单元是CPU的指挥中心,运算单元是CPU的执行部分,存储单元用于暂时存放待处理或已处理的数据。
3 Z2 S0 @! P( P' ?
% T' s6 t7 g- Z& a 由于CPU行业设计技术门槛高、研发周期长,这导致该行业存在着较高的壁垒。长期以来CPU行业都被两大生态体系占据。一种是由Intel x86架构与Windows操作系统组成的Wintel体系,另一种是由ARM指令架构与Android操作系统组成的AA体系,均为国外主导,芯片国产化率较低。因此,在“十五”期间,国家启动了一系列计划包括泰山和863等,此举也推动了国产CPU自主研发和生产。鲲鹏、飞腾、龙芯、兆芯、海光、申威等一批优质国产CPU厂商迅速崛起。
9 ], {1 y5 E" N1 Q, {/ i , N# m) w+ F, r* }' T6 E2 J- h
二、六大国产CPU厂商分析" x9 K0 m1 u. ^) p
$ l/ p* N/ b7 s0 U 1、华为鲲鹏:自研芯片引领者6 j& E6 W3 g3 I; G1 [
, |. y0 t7 T% V1 ]" `" l 华为芯片主要是旗下的海思研发,前身为华为集成电路设计中心。1991年启动集成电路设计及研发业务,从2004年开始基于ARM技术自研芯片,拥有ARM v8.1架构的永久授权。基于ARM架构,华为研发出了五大系列,服务器鲲鹏芯片、手机SOC芯片麒麟系列、人工智能芯片昇腾系列、5G基站芯片天罡系列、5G手机基带芯片巴龙系列,以及一系列专用芯片,如家用路由器领域的凌霄芯片、NB-IoT(窄带物联网)芯片、视频编码解码芯片以及SSD控制芯片等。
' f4 Q# W; H6 f6 k2 D! x v+ Z
7 c% u' }( c" u" G9 y% f6 V/ M2 E 2014年,华为发布了鲲鹏912处理器,2016年发布了鲲鹏916处理器。2019年1月,华为正式发布了鲲鹏920芯片,这是行业内首款7nm数据中心ARM处理器,专为大数据处理和分布式存储等应用而设计。鲲鹏920由华为自主研发,采用多发射、乱序执行和优化分支预测等多种技术手段来提升单核性能。# k. ]8 Y: W. l$ h4 M( \
1 e& h+ h Y* I$ |3 N5 F 该芯片具备64个内核,集成8通道DDR4,提供多个接口,主频可达2.6GHz,总内存带宽最高可达1.5Tb/s。鲲鹏920支持PCIe 4.0和CCIX接口,总带宽达到640Gbps。采用3级Cache架构,在非X86架构芯片中,鲲鹏920在算力方面处于领先地位,并已发展到与X86芯片相匹配的性能水平。
; D9 S4 q& A9 x: l
0 t1 v* p2 H. M, _ 与竞争对手的对比,鲲鹏920在48核心时的整数性能与英特尔至强8180相当,但功耗降低了20%。而在64核心方面,鲲鹏920相比英特尔至强8180提升了约33%。值得一提的是,英特尔至强8180是英特尔的服务器旗舰芯片,拥有28个核心和2.5GHz的频率,在X86服务器中被广泛应用。) E- F' M) B z+ l; E7 K
8 ~# i0 B9 v4 I S3 t; L 参照鲲鹏920不同核心下与竞品芯片的对比,其在48核的时候,整数打平英特尔至强8180,功耗低20%。而在64核心方面,鲲鹏920相比英特尔至强8180提升了约33%。值得一提的是,英特尔至强8180是英特尔的服务器旗舰芯片,拥有28个核心和2.5GHz的频率,在X86服务器中被广泛应用。* g9 R. \* M, [1 E/ l% l$ G- {
; [" {+ t) a5 `8 h! X- U 在鲲鹏开发者峰会2023上,华为ICT产品组合管理与解决方案部总裁马海旭表示,鲲鹏生态目前已有4500家合作伙伴,超过200多万名开发者,13500多个解决方案通过鲲鹏适配的认证,在政府、金融、电力、运营商等行业得到规模应用。目前华为鲲鹏的合作方,在操作系统方面包括:诚迈科技、中国软件等;中间件部分有:东方通、宝兰德、普元信息等;办公软件有:金山办公、万兴科技,目前WPS+WeLink已经适配上华为体系。整机包括:东华软件、神州数码、拓维信息、同方股份、广电运通等。) O' j. I: M' g! n# J$ w3 _& |! e
# X$ P% V# t. C1 x2 h" C& _1 ] 2、飞腾:PKS生态主导者$ b( M0 ~% v( ~. \6 n0 M! v: N
1 M0 q, j4 M0 c e) q8 V. V 2014年,中国电子信息产业集团、天津市滨海新区政府和天津先进技术研究院联合成立,飞腾信息技术。飞腾CPU包括,飞腾服务器CPU、国产飞腾桌面CPU、国产飞腾嵌入式CPU等系列产品。
7 j, J8 e7 d$ H L 2 P& j1 V1 ?: U9 @/ Z
2020年,飞腾公司发布腾云系列新一代CPU,其中腾云S2500,相比上一代FT 2000+性能大幅提升。整机性能方面,双路的SPECint分值为原来的2倍,四路的SPECint值为原来的3.5倍。分布式数据库性能方面,双路服务器的tpmc值线性提升至原来的2倍,四路的tpmc值线性提升至原来的4倍。云桌面支持方面,双路服务器支持虚拟机70个,是原来的2.5倍,四路服务器支持140个,是原来的5倍。' d9 D# ?$ h; k0 r7 R: u( p
' j6 r" P. n! q6 n6 ~6 X* s
腾锐D2000桌面处理器芯片,相比上一代产品FT-2000/4桌面处理器芯片,最新飞腾高效能桌面CPU腾锐D2000的性能大幅跃升。带宽达18.7GB/s,SPECint分值为97.45,SPECfp分值为94.62,接近原来的2倍。在计算能力上得到进一步提升,并兼顾桌面终端与边缘服务器,丰富了应用场景。腾锐D2000与FT-2000/4产品管脚兼容,实现现有系统的原位拔插代换、无缝兼容,降低了研发成本和整机合作伙伴的开发难度。
( v$ F$ m1 I8 L5 F# |% M5 O J: c- s( J0 V; R6 F
目前飞腾已经成为了,PKS体系的主导者,成为行业生态构建的标杆。PKS体系融合了飞腾CPU和麒麟操作系统的技术,并结合硬件级安全机制和可信技术,实现了底层构架的本质安全。飞腾成为国内首个计算机软硬件基础体系标准,并将“可信计算3.0”技术融入到CPU、操作系统和存储控制器中。
6 F. U. a% `2 h3 ^. l& O
) h/ t# n& y+ X6 R 飞腾公司在生态建设方面取得了显著的成就,为我国行业的自主创新作出了重要的贡献。在生态建设方面,飞腾已与1600余家国内软硬件厂商合作,打造完整生态体系,适配了6大类1000余种整机产品,2600余种软件和外设。基于飞腾桌面CPU的终端已形成了较为完整的生态图谱,可覆盖从整机硬件、基础软件到上层的应用。基于飞腾桌面CPU的终端产品已能够实现海量Android应用的运行等。9 @0 n! V, _6 y# J& I* _. S
4 S2 d& K( a0 W1 O/ h! F" Q, X
在今年5月19日,第七届世界智能大会上,飞腾携手了同泰怡、京信、亚信、浪潮、爱瑞、沐创、中电互联、爱浦路等 13 家 5G 生态伙伴重磅发布了《飞腾5G生态解决方案白皮书》,共同推进国产 5G 生态的繁荣和产业发展。$ o/ B$ o; w+ M a+ A/ p
: I! v2 e1 S k" }
3、龙芯中科:自主架构先行者
7 d. I1 {" f6 c- x
+ `: i: U8 x% c6 u% M 龙芯是中国科学院计算自主研发的通用CPU,采用自主LoongISA指令系统,兼容MIPS指令。该处理器拥有自主设计的所有IP模块,具备片内安全机制和高可信性,龙芯处理器以32位核64位单核及多核CPU/SOC为主,主要应用于高端嵌入式、个人电脑、服务器和高性能机等领域。2002年8月,龙芯一号面世,成为中国首款拥有自主知识产权的通用高性能微处理芯片。龙芯至今已开发了1号、2号、3号三个系列处理器和龙芯桥片系列,并在政企、安全、金融、能源等领域得到广泛应用。0 m+ \0 X6 Q$ s% D: x6 K
0 K% ?; t, ?/ l. J: E9 Z( C( J& y
龙芯中科产品体系可分为三大系列,龙芯1号系列是低功耗、低成本的专用嵌入式SoC或MCU处理器,针对嵌入式专用应用领域进行定制;龙芯2号系列是低功耗通用处理器,采用单芯片SoC设计,适用于工业控制与终端等领域,类似于Intel的凌动系列;龙芯3号系列是高性能通用处理器,通常集成4个及以上64位高性能处理器核,与桥片配套使用,主要应用于桌面和服务器等信息化领域,类似于Intel的酷睿/至强系列。
8 b' g/ I! r: x$ J5 P- G# ?, e4 b ' ^0 t# d' y7 Y+ W" |% b
今年4月,龙芯推出了2023款HPC CPU:3D5000,拥有32个核心,主频高达2 GHz,TDP为300W。据称,该处理器比典型Arm芯片快4倍。龙芯3D5000 CPU采用了两个现有的3C5000芯片的小芯片封装方式,面向国内服务器细分市场和HPC客户。龙芯3D5000的推出进一步满足了数据中心对性能的需求,并使龙芯中科在服务器CPU芯片领域进入国内领先地位。
: |; R- [7 U8 o# x8 U) g- P 9 g0 P( }5 S- ^" P
4、兆芯:自主通用处理器领军者
2 X1 O8 V* P* A3 w' o" x : y G* g3 X* K2 t2 m
兆芯成立于2013年,由中国台湾威盛与隶属于上海市国资委的上海联和投资公司所合资成立,威盛持股20%,上海国资委持股80%。同时掌握中央处理器、图形处理器、芯片组三大核心技术,具备相关IP自主设计研发的能力。目前,公司已经申请了1500余件专利,并获得了约1300件专利授权。
6 c+ M+ p1 f4 ?( X9 k9 }2 a$ }
1 r; z3 W: T8 l- l- K' L 自成立以来,兆芯成功研发并量产了多款通用处理器产品,并形成了“开先”和“开胜”两大产品系列。这些处理器具备良好的操作系统和软硬件兼容性,生态体系成熟,支持台式机、笔记本、一体机、云终端等多种类型的桌面整机,以及服务器、存储等产品。此外,在嵌入式领域,兆芯还推出了基于其通用处理器的工业主板、模块化电脑、工业整机、Box PC、工业级服务器、网络安全平台等不同规格的产品。8 v( S, \) s# u5 K7 I4 ?
; R) }) x4 R' X+ H+ b$ o 开先KX-6000和开胜KH-30000系列处理器是业内首款完整集成CPU、GPU和芯片组的SoC单芯片国产通用处理器。这种设计为整机系统的开发提供了便利条件,同时也更有利于成本控制。与第七代4核心英特尔i5相比,KX-6000系列处理器的8核心产品在整体性能上仍存在差距,特别是单核性能不及第七代i5的一半。然而,在整数性能方面,KX-6000系列处理器实现了对英特尔i5的超越,性能提升了多达50%。而同频下的性能功耗比是上一代产品的3倍。4 B5 ^- F6 ^( g* L
* I _9 ^7 Y4 Y9 z. A# n8 ` 目前,基于兆芯的新一代处理器(KX-6000/KH-30000),与联想、同方、东海、海尔、锐捷、升腾、攀升等品牌已经推出了20多款不同形态的桌面电脑和服务器产品。此外,研华、研祥、盛博、威强电、信步、安勤、深惟、华北工控、汉智兴、智微、芯杰英、经纬天地、凌壹、海川智能、爱鑫微、众新等30多种工业主板、工业电脑模块和嵌入式计算平台,以及30多种网络安全平台也相继推出。: B2 i8 v4 S- F% c6 s5 b' D; G
" v t* ?7 h0 ~ 5、海光:高端处理器产业引领者
* z: {9 ^4 S. f6 x& c / @6 P$ s; x. z7 F/ ^' K
海光信息成立于2014年,专注于高端处理器和加速器等计算芯片产品与系统的研发。海光处理器兼容市场主流的X86指令集,拥有成熟而丰富的应用生态环境。该处理器内置专用安全硬件,支持通用的可信计算标准,实现主动安全防御,最大程度地减少安全漏洞和隐患,满足信息安全的发展需求。第一大股东中科曙光的高效协同为公司产品放量打下了深厚基础。' |% B: B+ j- d3 W6 W0 O8 F
! t, m% h+ K5 I) Z9 O( x Y 并且海光信息与AMD公司有着紧密的合作关系。2016年,AMD公司与海光信息合资成立了成都海光微电子技术有限公司和成都海光集成电路设计有限公司,授权海光微电子使用x86指令集和Zen架构,并获得了2.93亿美元的授权费。海光集成电路购买了海光微电子的IP授权,以此为基础开发了CPU。海光集成电路和海光微电子的股权结构使得海光在规避英特尔的x86授权限制的同时,实现了由国内公司开发的x86 CPU,符合国家产业政策和创新需求。
. A4 x1 S W' q3 M/ O # T5 k- k! |) F$ ~
海光CPU系列产品包括3000、5000和7000,它们在技术设计和处理器核心等方面具有相似的特征。其中,海光3000系列主要应用于工作站和边缘计算服务器,海光5000系列主要应用于中低端服务器,海光7000系列主要应用于高端服务器。在性能方面,以海光7285为例,与英特尔志强铂金系列CPU相比,在典型场景下,性能已接近国际同类高端产品水平。
8 X; A; Z' h* l; G% f. {
j1 C: @5 z4 M' P 目前公司产品已经广泛应用于电信和金融两个领域。近年来,公司不断推出海光二号处理器和深算一号DCU处理器,丰富产品线,加大市场开拓力度,逐步构建了基于海光处理器的完善产业生态环境。凭借在电信、金融和互联网等行业的认可,公司在电信运营商集采和金融行业入围等领域的市场份额迅速增长,相关重点行业的产品销量逐渐提升。
- M$ m$ [+ M4 i3 ^8 O! u0 x
6 C# w2 A; X: ]- K2 Z' ~/ o 6、申威:特种领域领导者
+ R7 R, }! g+ B6 {% M- k ! }$ `% M3 g5 E+ E/ C
成都申威科技成立于2016年,主要从事申威处理器的产业化推广。核心业务包括申威处理器芯片内核、封装设计、技术支持服务和销售,小型超级计算机的研发、测试、销售、服务以及核心部件的生产,基于申威处理器的软件和中间件开发,嵌入式计算机系统的定制化产品服务,以及集成电路IP核的知识产权授权。
3 t5 I7 F+ t/ c2 ]( L
# }- R7 ~/ B9 R, I& A, M 申威处理器基于Alpha指令集进行扩展,具备高度自主可控性。Alpha指令集是由美国DEC公司研制的,主要用于64位RISC微处理器。后来DEC公司被美国惠普收购,无锡江南计算所获得了Alpha指令集的全部设计资料。基于原有的Alpha指令集,江南计算所开发了更多自主知识产权的指令集,并设计了申威指令系统,推出了申威处理器。申威处理器是在国家“核高基”重大专项的支持下,由上海高性能集成电路中心研制的国产处理器。首款申威处理器代号为"SW-1",于2006年研制成功,基于DEC公司的Alpha架构,采用130nm制程,主频为900MHz。* R3 |/ Y+ i! o
& Q' m5 n# c( ^& F 出于安全性能和知识产权的考虑,申威在开发了基于Alpha指令集的第一代CPU后,就将指令集替换为自主研发的申威64位指令集,与原有的Alpha指令集完全不同。申威处理器专注于高性能计算,特别在服务器领域具有与同期外国处理器相当的浮点运算能力。申威的主要代表产品包括SW1600、SW1610和SW26010。其中,申威SW26010是中国首个采用自主架构且性能强大的计算机芯片。& y! H7 F [8 O) f; [- C9 L
' K- \) ^4 u) L$ {; J 申威26010处理器的峰值性能超过每秒12.5万万亿次浮点运算,峰值速度、持续性能和性能功耗比在全球处于领先地位。2016年,法兰克福世界超级计算机大会上,搭载申威26010处理器的“神威·太湖之光”超级计算机荣登国际TOP500榜单首位。随后,我国科研人员依托“神威·太湖之光”超级计算机的应用成果首次荣获“戈登·贝尔”奖,实现了我国高性能计算应用成果在该奖项上零的突破。; E' Q9 S) _' [5 b9 \* n0 ?6 @, N b8 J
. n; Z2 @1 O4 p+ q! U
三、CPU市场现状及国内外主要CPU性能参数对比$ b1 P: `$ j5 q$ X; ^1 n$ O
& E4 u# b! l9 y 从市场份额来看,目前全球CPU行业基本由Intel和AMD垄断,整体来看,Intel具备先发优势、是全球X86CPU架构的龙头企业,AMD紧随其后。就技术而言,Intel和AMD还在不断实现微架构的迭代更新,持续保持其市场领先的地位。
8 T6 e, O; ]3 n+ x1 N7 ?0 k
# t# s) O' K+ }! ~6 t6 O: ?/ l: I2 ~ 根据Counterpoint发布的最新研究,2022年全球数据中心CPU市场收入同比下降4.4%。宏观经济逆风和能源成本增加影响了这一年数据中心CPU的销售。2022 年,英特尔CPU收入同比下降16%,但仍以71%的份额保持市场领先地位。而AMD在2022年,同比增长了62%,以20%的市场份额位居第二。
/ V) F5 L2 h! K$ e; B Y% v, Y9 c" L
) ~) Z. g. P9 F2 D5 ?: R 英特尔在CPU市场一直保持领先地位。早在上世纪80年代英特尔就自主研发了X86指令系统架构,并凭借先发优势迅速扩大了市场份额,构建了生态优势。通过与Windows形成“Wintel”联盟,逐步占领了桌面CPU市场。ARM则在苹果、高通、三星、华为、英伟达等众多公司的努力下,凭借其指令系统开源、异构运算和可定制化等优势,成功立足于低功耗的移动市场。, A e# z* q; e( l, I* q8 i3 h, S
5 B( c$ k3 z. F+ p# k
对比国内外,国产CPU与国际大厂仍存在一定差距。首先,在CPU的参数方面,国产CPU在一些关键性能方面已能与海外大厂媲美,但仍有提升空间。国产CPU在核心数、主频、内存等参数上已有部分与国际厂商接近的表现。然而,综合性能指标仍有改进的余地。例如,海光7285在核心数、超线程数、内存及通道数方面与AMD、Intel产品相近,但在主频和内存频率方面稍逊,可能对综合效率和稳定性产生一定影响。
4 r; Y" @; H! R1 d' H' P/ M4 Y. Z
: ~, q6 M- A' H! t' ~- ]# ?1 l 此外,相比Intel和AMD,国产CPU起步较晚,并且国内先进制程的晶圆加工工艺与国外仍有差距,这也导致整体性能仍有提升的空间。根据前瞻产业研究院的统计数据,中国是全球CPU技术的主要来源地,专利申请数量占全球总量的58.32%,随着研发投入的增加,国产CPU技术的突破未来可期!
/ _) w4 }, n4 b& F0 f4 i( q- f
3 |! \8 m7 }5 o" E8 [$ j