介绍公司的情况,内容涉及技术研发、市场策略、财务状况等多个方面。
欢迎各位投资人参加龙芯中科 2023 年以及 2024 年一季度业绩说明会。
我的报告分三个部分:
第一,龙芯当前的形势和任务;
第二,2023 年以及 2024 年一季度的工作报告,分成市场报告和研发报告;
第三大部分是 2024 年的工作思路。
首先报告一下龙芯当前的形势和任务。
龙芯当前的形势和任务是:我们处在新一轮的三年转型期。上一轮三年转型是从中科院计算所走出来办企业,打开了政策性市场,具体是在 2013 年 - 2015 年我们进行了艰难的转型。这次新一轮的转型是 2022 年到 2024 年。
我们为什么要转型?2022 年我们面临的形势是这样的:
一方面,研发方面有了足够的积累,系统掌握了指令系统、CPU 和操作系统的关键核心技术,完成技术“补课”,标志就是我们有了自己的指令系统。基于自主指令系统,研制出像 3A5000、3C5000 这样的桌面和服务器 CPU,我们还有了基于自主指令系统的基础版操作系统。我们有了 CPU,我们有了操作系统,缺的是生态。
另一方面,过去支撑龙芯发展的政策性市场不稳定,而且竞争加剧。我们当时要开拓开放市场有很大的困难。大家知道政策性市场,尤其是电子政务的政策性市场,在 2022 年就基本上处于停滞的状态,而且面临 X86 和 ARM 直接的竞争。现在有三条技术路线:X86、ARM 和龙芯路线。
我们转型的目标很清楚:
一是摆脱对政策性市场的过度依赖,要走向开放市场。我经常说,研发能力比龙芯弱得多的国内芯片企业,活得都比龙芯好,难的是要怎么跟市场结合。
第二,在政策性市场要把自主研发能力转化为性价比和软件生态的优势。可能很多人都会觉得龙芯最自主,我们都承认,但是因为龙芯是自主的,所以性能肯定是最低的,软件生态肯定是最差的——这个逻辑要把它反过来。在政策性市场,因为龙芯是自主的,所以性能是最高的,软件生态也是最好的,要形成这样一个逻辑。
转型的主要方向是研发转型。我们判断,龙芯在转型之前的主要矛盾在产品端,就是产品竞争力不够。很多人觉得龙芯销售有问题,销售是有问题的,但是主要问题在产品端。
所以我们转型有三个具体措施:
一、通过芯片升级提升单核性能,再到通过芯片升级和系统优化提升系统性价比。这里面有两个台阶:过去我们强调单核性能,我觉得我们中国跟国外 CPU 主要差距在单核性能,而不在于核数不够多。所以 2010 年 - 2020 年十年我们只做四核,做四核结果就是服务器这块市场就不好做,但也要把单核性能做完。从单核性能到系统性价比,中间有个芯片的性价比,再到系统的性价比。始于 3A6000,还有配套的桥片 7A2000。光是把 CPU 成本降下来还不够,外围的配套降下来才能(系统)性价比高。这是第一个:从单核性能到系统性价比(系统是整机系统,单核是芯片的一部分)。
二、基础软件研发:从操作系统和硬件的结合部,到更加重视操作系统跟应用的结合部。过去龙芯早期用 MIPS 系统,后来用龙架构系统,操作系统跟硬件的适配,包括浏览器、基础软件、微信、QQ 这些东西都是缺的,因为我们不是 X86 不是 ARM。过去基础软件研发重点是操作系统跟硬件的结合部,现在要转向操作系统跟应用的结合部,强调应用生态,要跑更多的应用,甚至要跑得比 X86、ARM 还要好。
三、形成 CPU、操作系统、主板“三位一体”的通用解决方案能力,还有结合应用需求研发专用解决方案。信息产业是解决方案为王的产业。我们有个原则:我如果不会做这个整机,我就不要做这样芯片。比如说我会做 PC,所以我卖 PC 的芯片;我会做服务器,所以我卖服务器的芯片。Intel 和微软表面上是做芯片、做操作系统的,但实际上电脑是他们设计的。这是三个方向,三个转型的措施。
转型的战略方针就是“点面结合、两点一面”。
首先讲“面”:就是持续完善基础软件平台,大幅提升龙芯通用 CPU 的性价比和软件生态。这是“面”。我们有 3A6000 + 7A2000、3C6000、2K3000 等通用 CPU,我管它叫“三剑客”。我们待会儿会讲“三剑客”。我认为龙芯到了“三剑客”这一代,如果不考虑软件生态,性价比在开放市场跟 Intel、AMD 比,有优势。要做到这个样子。
在这个基础上要做硬件生态,研制和通用 CPU 配套的芯片:接口桥片、GPGPU、BMC、RAID 等。自我配套才能降低系统成本。可能大家很关注龙芯 GPGPU 做得怎么样了,但实际上这个配套的芯片是一整套的:接口、BMC 还有 RAID 卡。GPU 是跟 PC 配套的,服务器上可以做加速卡,RAID 是跟服务器配套的。要整个系统做起来,降低系统成本。
我们分三步走:
第一步叫夯实基础,龙架构的 Linux 基础得打牢;
第二步是广泛兼容,要让 x86 的 Windows 应用在龙芯(PC)能直接跑;
第三是自主应用,像 Windows、Android 那样形成自己的应用生态。
分三步走来构建这个“面”,是龙芯打造第三套生态的基础,也是我们的目标。这个是不会变的,但是也不能死守这个“面”,要做些“点”。
两个“点”直接走向开放市场:
第一个“点”是基于通用 CPU 研制具有开放市场竞争力的专用解决方案。我这里列了一些通用 CPU,比如 3A5000、3A6000、3C5000、3C6000、2K1500、2K2000、2K3000 等,这些都是面向 PC、服务器或者工控的通用型 CPU。其中 3C6000 是去年年底付流片,还没有回来;2K3000 今年上半年流片;其他的都已经有了。这些芯片在通用的市场单独拿去卖,可能还有一些壁垒,但是如果做专用的解决方案,比如做存储服务器、专用服务器——存储服务器软件只要搞定一个就行,没有那么多生态壁垒,只要搞定存储软件。还有云终端、一些工业控制,软件生态壁垒不高的。要通过系统解决方案形成性价比,这样我们就能走向开放市场了,不一定在政策市场里面等。
第二个“点”就是结合特定应用需求,研制具有开放市场竞争力的嵌入式专用芯片。第二个“点”就是要做一些专用芯片,它本身具有很强的竞争力,比如最近在做的 2K0300、1C203、2P0300 等嵌入式专用 SoC 和 MCU,我管它叫“三尖兵”。这些应用场景都是没有生态壁垒的,都是专用的或者工控的、嵌入式的,没有生态壁垒,拼的就是性价比,能不能打得赢别人。
专用芯片我们一直在探索,最后确定了三个方向:打印机、电机驱动、流量表。就三个方向做专用芯片,做就做透。打印机是一个很特殊的行业,我们中国各种品牌的各种整机占全球都在 50% 以上,但中国品牌打印机占全球不到 5%,所以这个空间很大。电机驱动和流量表,要研制具有终极性价比的专用芯片。什么叫终极性价比呢?也就说只要我龙芯推出来了,性价比肯定是全球最高的。
“点面结合、两点一面”是我们转型时期的战略方针。
提到“三剑客”和“三尖兵”,我们回顾一下最近几年芯片研发的情况。
2022 年我们上市融资之后,能力有了很大提高,每年可以新推出五款左右的芯片(不含有些改版)。因为芯片样片回来我要改版,新的芯片五款左右。我们 2010 年 - 2021 年之前,我算了一下,每年平均是一到两款,这 11 年加起来不到 20 款。我们融资、上市,队伍扩大,加上积累,对我们确实是有好处的。
2022 年我们有 6 款,这 6 款里边紫色的这 3 款实际上是老的芯片改版。为什么老的芯片改版?我们一直有一个感觉:龙芯不能寄希望于不受制裁,而是要寄希望于不怕制裁。所以我们把已经有的芯片进行改版,两个方向转移:一个是工艺的转移,从不安全的工艺向安全的工艺转移;第二是指令系统转移,从原来需要授权的 MIPS 到龙架构的转移。所以我们 2020 年 - 2021 年花了很多力气做转移,当我们受制裁的时候,业务没有受影响,供应没有受到影响。这是花了很多时间转移的。2023 年有一颗芯片做转移,以后就都是新的了。
这些红色字的 3A6000、2P0500、1J200 这几个都是 2023 年新(流片)回来的。2024 年一季度已经(流片)回来了 2K0300、3C6000、7A2000、1C203 这几个已经交付流片了,所以我用蓝色标志。2K3000、2P0300(计划)今年上半年交付流片。
“三剑客”通用 CPU 大幅提升性价比,跟我们上一代 3A5000、3C5000 比,可以参与开放市场竞争。比如 3A6000 + 7A2000,现在有个老的 7A2000,成本还偏高,如果这个(新 7A2000)回来,性能提升 60%~70%,相当于 2020 年 10 代 4 核酷睿水平,成本降低 30%。服务器系列:16/32/64 核的服务器 CPU 性能翻番、成本减半,性价比就是四倍,都很有竞争力。2K3000 是 8 核(SoC),单核性能跟上一代 3A5000 相当,核数翻番,成本也是减半。我们的研发思路非常强调性价比,我觉得如果光是讲性价比,开放市场可以打。大家可能会说有软件生态问题,待会儿再讲。比如服务器的生态壁垒就不高,云终端生态壁垒也不高。
“三尖兵”就是杀鸡用牛刀,嵌入式/专用 CPU 达到极致性能比。我们有 2K0300,原来我们在工控领域有个芯片 1B,主频 200MHz,现在(主频)升级到 1GHz,性能提高好多倍,但成本还低于(1B)。这个芯片(流片)回来了,我觉得有竞争力。1C203 电机专用芯片性能比我们上一代提高 3-5 倍,每分钟可以支持 20 万转的无刷电机,成本降了 2/3。(2P0300)激光打印机专用芯片是基于 2P500。
为什么要做“三尖兵”?其实这几个一年卖 1000 万片,对营收(的影响)也就是一两个亿,但是对龙芯这样一个从科学院走出来的团队是很有必要的,因为我们要建立一种成本的意识,每个环节怎么降成本。我们需要尝一尝开放市场是怎么打的。你没有在开放市场一分钱一分钱扣过(成本),这个团队高端的开放市场也打不开。所以选了这些东西要去打开放市场,当然也会给我们增加营收。
我判断,完成三年转型(2022 年 - 2024 年),龙芯发展主要矛盾要从研发端转向市场端。这是龙芯目前的形势和任务。
下边报告 2023 年以及 2024 年的一季度工作报告。
2023 年的工作摘要
2023 年是龙芯开展生态建设和面向开放市场三年转型的攻坚之年(2022 年是起步之年,2023 是攻坚之年)。面对龙芯某传统优势的工控市场和电子政务市场调整停滞和外部竞争不断加剧的严峻形势,公司坚持生态建设的目标不动摇,不等不靠、积极作为。确实 2023 年是困难的,我们传统的优势工控市场停滞了,电子政务市场也停滞了,所以确实是困难的。
在这种情况提出“点面结合”的经营方针,把自主化的优势转化为性价比和软件生态的优势:
快速提高通用 CPU 的性价比并完善软件生态(这是刚才说的“面”);
基于通用 CPU 研制面向特定应用的具有开放市场性价比优势的专门解决方案(这是基于通用 CPU 做解决方案的“点”);
结合特定应用需求,研制具有开放市场性价比优势的嵌入式专门芯片(也是个“点”)。
“一面两点”或者“两点一面”,大幅提升龙芯 CPU 的市场竞争力,这是“点面结合”。
采取“纵横结合”的市场策略,通过 CPU、操作系统、ODM“三位一体”的通用解决方案能力,以及面向特定应用的专用解决方案能力,组织和重构产业链。当然现有的产业链要支持,但 Intel 打败 IBM 的时候建立了一个新的生态,ARM 打败 Intel 的时候重构了产业链,跟他合作的都不是原来产业链的那些人。
坚持实事求是的原则,采取积极稳妥的销售策略,优化销售渠道管理和产品定价方式,夯实可持续发展基础。继续按照上市企业要求,优化公司治理架构及管理流程。成功召开大型 3A6000 发布会及生态伙伴大会。
这是 2023 年的工作摘要,2023 年的市场工作报告。
首先跟大家报告一下财务情况,我们已经都发了(公告)。
营收是 5.06 亿元,同比下降 31%。毛利率有所下降,净利润是亏了 3.29 亿元。净资产收益率、每股收益率是根据这些数据算出来。
现金流我要讲一下一些内在的逻辑:我们去年现金流下降 4.1 亿元,前年是下降了 7.7 亿元,现金流下降放缓,这是个好的趋势。我们为什么前年会下降那么多?两个原因:一个是我们加大研发投入,我记得从年初的 700 多人(口误:800 多)到 900 多人(公司在编员工);另外我们要做好积极的准备,要有足够的库存,迎接供应链的不稳定。我们库存随着研发(投入)涨,还增加了一些库存。
我们的人员稳住了,而且收款增加。我们去年 5.06 亿的营收,销售收款是 6.8 亿,就是应收账款减少。这是 2023 年财务情况。
收入组成说明一下:
工控类芯片营收 1.6 亿元,同比下降 41%。首先这是临时性的,因为它有特殊的原因,但是我们其他的领域发展的还是不错的,比如说能源、交通这些还是发展的不错。
信息化类芯片也下降了不少,下降 51%,毛利率偏低。毛利率低是因为摊销大了,因为卖的少,摊销大了。电子政务市场继续调整停滞,芯片销量小所以摊销占比高,毛利润降低。但是我们也看到 2023 年 Q4 市场是回暖的,回暖过程中持续消耗整机的库存。因为在 2021 年以及 2022 年上半年过程中,整机(厂商)觉得市场会继续(向好)会有很多库存,新的市场要先把整机库存消化掉。
解决方案下降 8%,而且毛利率也下降。但是这里边服务器的销量是增加的,因为我们开始做服务器了,刚开始我们有 16 核、32 核芯片。
2024 年一季度财务情况:
收入是 1.2 亿元,开始恢复增长。毛利率继续下降,净利润 -0.75 亿元,跟去年是基本持平了。
现金流净额是一个比较好的变化:去年一季度我们是减少了 1.7 亿元,今年一季度是基本持平。我们为什么能够做到基本持平?一个是为了保障供应的安全做的库存(准备)基本上结束了,已经能够转起来了,就不用说为了怕突然被卡住要存很多库存(2022 年做了不少,2023 也做了一些,这个基本就结束了)。第二,总体上收款额还是高于收入额的。还有一个就是库存减少一些。
2024 年一季度收入组成:
工控类芯片从 5000 多万降到 3000 多万,还是有所下降。某领域特殊原因导致芯片销量临时减少,工控其它领域形势不错。
信息化类芯片增长的比较多,从 3000 多万涨到 6000 多万,毛利率也在增加,因为摊销小了(每颗芯片摊销小了)。信息化类芯片(收入)增加 123%,毛利率增加 10 个百分点。有这么几个原因:一个是整机企业库存芯片在 2023 年得到有效消耗(2022 年整机企业手头有好多库存,2023 年虽然不断在出货,但是主要是消耗库存);还有一个原因我们 3A6000 市场竞争力增强,整机企业喜欢它。但是今年的一季度电子政务市场总体上仍处于调整期,因为有关的文件还没有出台,比如说我们 3A6000 还没有在有关文件里。
解决方案营收也下降一些,毛利率是增加的。我们 2024 年开始调整销售策略,整机型解决方案卖的少了,主要是板卡级解决方案为主。2023 年的营收里整机型解决方案还是不少的,今年开始整机要减少(比如)白牌机,以板卡解决方案为主。
信息化应用和工控应用分别我讲一下我自己的看法。
信息化应用攻坚克难,展现出良好发展势头。首先“面”(也是“点面结合”):持续改进性价比和软件生态,以芯片销售为主。
一是提升产品竞争力:3A5000,3C5000、3D5000 这两个是服务器(芯片),3A6000 性能提升。龙芯打印机驱动和浏览器生态有优势了,我待会儿会讲到。Linux 我们现在信创的一个大问题就是打印机,因为绝大多数打印机都只有 Windows 的驱动,Linux 的驱动是没有的。龙芯有一个一招鲜就是把 Linux 打印机驱动基本搞定了,这个比 X86 还好。不管是产品本身还是软件生态都不断的在改进。
重构产业链:我们对产业链进行了分类,继续支持第一梯队的整机企业(第一梯队整机企业就是传统的整机企业,比如像联想、浪潮、同方这些传统整机企业),我们要继续支持好,他们都有龙芯的产品。重点发展第二梯队的整机企业:有很多整机企业,现在有几十家,随着政策性市场起来,这里边有很多整机企业只做龙芯,因为龙芯是所有信创 CPU 里面最开放的。我们长期坚持没有让任何一个整机企业来入股龙芯,龙芯保持着 Intel 这样开放的模式(其他很多 CPU 都是被整机企业控制的)。这是龙芯最近一个比较好的增长点。还有积极培育第三梯队系统企业:有些系统企业,他原来做软件的或者系统的,他喜欢用白牌机,或者自己就不愿意招标买别人整机希望自己做整机了。还有充分发挥整机渠道作用,形成利益共同体:整机后头比如在各种采购当中,整机也是通过渠道卖出去的,龙芯作为 CPU 原厂为什么不直接跟渠道合作呢?这是“面”。
“点”就是结合特定应用,通过软硬件定制和产业链重构提升性价比。软硬件定制就可以提升性价比,还有产业链重构,比如对一些特定应用,他不用品牌操作系统,也不用品牌整机,我们支持他直接做整机,用龙芯的开源操作系统就能做解决方案,这就降低了成本。
网络存储服务器去年也有比较大的进展,去年营收的百分之十几是存储服务器,没有生态壁垒,系统企业直接跟我们合作,容易做出性价比来。
龙芯云平台解决方案形成批量销售。
服务器的 BMC 达到可用水平,现在有些 ARM 的服务器 BMC 卡也是用我们的芯片。
行业终端、云终端、彩票机、金融终端形成小批量销售,我估计今年、明年批量会大起来。
还有中小学编程教育、高校体系结构实验室继续带动市场销售。
行业的解决方案,这些都是龙芯掌握了解决方案,有些卖板卡、有些卖芯片。
这个“点”,开始提高竞争力。龙芯整机中标和选用数量明显提升,2023 年全年整机出货增加 30%(2023 年比 2022 年,下游的整机企业出货是增加的,只不过是他要消耗库存),有效地消耗了整机和渠道 2022 年以来的积压的库存芯片。
还有一个比较好的是:2024 年一季度龙芯 3A5000 跟 3A6000 终端的 CPU 芯片出货量超过 2023 年全年的。2023 年整机要消耗库存,我们的桌面、服务器芯片就出的少,2023 年库存消耗了一下,另外 3A6000 竞争力提高,大家喜欢,所以一季度就是超过了 2023 全年。
第二,16 核 3C5000、32 核 3D5000,现在看起来这个 16 核和 32 核当时着急增加核数,稍微有点仓促,但是因为龙芯有了服务器芯片,服务器还是带动了销售明显提升。我总的感觉可能去年五点几亿的营收里边个把亿跟服务器相关。这是信息化。
工控应用积极探索,有效提高市场竞争力。还是“点”和“面”的工作。
不断完善 CPU 和嵌入式操作系统:我们 2 号系列 2K500、2K1000LA、2K1500、2K2000 形成系列化,基于 3A5000 及 3C5000 走向中高端市场,产品竞争力在工控领域也在提升。
充分发挥龙芯掌握底层基础的优势,支持行业 ODM 和整机客户基于龙芯 CPU 开发工控产品。工控有个特点,都是垂直的。龙芯因为掌握底层技术,永远能够帮用户调的通。有些引进国外技术的 CPU,帮用户调着调着这块板卡就调不通了。这是龙芯的一个优势,因为你要帮用户调 BIOS、调内存参数,它不是内存条,它是表贴的内存,龙芯这是有优势的。
在试点的基础上优化渠道销售模式,发挥渠道积极性,保障资金安全,取得良好效果。去年在这方面我们采取比较积极稳妥的销售策略,为什么我们去年 5.06 亿的营收有大概 6.8 亿的收款?因为对这种渠道我们原则上采取先款后货,保证资金安全。
“点”是以解决方案带动芯片销售:
基于 2P0500 研制打印机解决方案,支持多家打印机企业推出基于 2P0500 的打印机产品。应该说 2P0500 是我们国内开放型的第一款打印机主控芯片,所以现在基于 2P0500 做主控芯片的单位很多。过去我们对自主对打印机有自主品牌的需求,但是对主控芯片是没有自主化的需求的。由于这个芯片的出台,在有些行业里边要求打印机主控芯片自主了,这是能够带动我们销售的。
基于 1 号系列的智能门锁、电机驱动等五金电子解决方案,下游的整机企业,我们卖芯片给他们出,货了几十万台。
还有水表、热表的流量表解决方开始小批量出货。
这是工控领域做的比较好的几个“点”。工控领域的生态壁垒较低,龙芯 CPU 开始展现性价比优势,开放市场取得积极进展。
3A5000 + 7A1000 在工业 PC 领域替代酷睿,现在已经有性价比竞争力。工控 IPC 一年全球的营收,工业 PC 也有大概六七十亿美元,相对的 CPU 也有 3000 万片。3A5000 相当于第三代酷睿,工业 PC 好多都是第三代、第四代酷睿还用着呢,我们有性价比优势。
2K1000 是主力产品,低功耗升级 2K1500 功耗下降了一半(原来 5W 主要下降到 2-3W),高性能的升级 2K2000,这几个现在看来都不错。
2K0300 是“三尖兵”之一,2K0300 对标了国外企业的几颗芯片,成本比它们大幅降低。嵌入式 SoC 和 1D 流量表专用芯片开放市场竞争力是很强的。2K0300 今年 3 月份回来的,现在看来市场还很踊跃。
前面讲的那些“三剑客”、“三尖兵”提高性价比,这是理论,需要实践检验。现在已经一个“剑客”出来了就是 3A6000,一季度检验了一下觉得还可以。2K0300 是今年一季度 3 月份才(流片)回来的,我们看有没有马上就有比较大的订单?解决方案做的怎么样?用户踊跃不踊跃?现在看来还都有点谨慎乐观。当时那个转型看来还是可以的,开放市场也比较接受的,或者政策性市场。但是真正的检验完得到今年下半年甚至到明年我们就检验完。我前面提的那是套理论(三年转型提高性价比,“三剑客”、“三尖兵”),要到今年下半年可以得到更充分的检验,到明年就看我这个思路对不对。
我们还持续加强生态建设:
继续支持龙架构高校人才培养:有 9 所新的合作高校和教育部合作项目加入龙架构教学体系。现在高校教的都是 X86 和 ARM,现在已经有 9 所高校以合作项目的方式加入,开始在大学里边教的是龙架构。有好多门跟指令系统相关的课程,像组成原理、操作系统、编译原理等五本教材交付出版,多所高校在本校开展配套实验的授课。这是人才生态,当然它本身也是个市场。
继续支持计算机体系结构能力大赛、嵌入式知识大赛、龙芯实训营、1+X 课程等都是基于龙芯的(从 MIPS 切换到龙架构)。像计算机体系结构大赛是圈子里边比较有名的赛事,如果这个大赛获奖,很多学校本科生保研是可以加分的。去年南京的软件杯大赛第一名也是用龙架构做的。
依托“中国自动化学会”成立自主指令系统技术与应用专委会(在筹备阶段)。
这是生态建设。为了做生态建设我们还采取一个措施:龙芯系列 CPU 核 IP 开放授权。我们有相当于 Cortex-M4、A55、A75 的这样一批核,对客户开始授权业务。过去龙芯是 Intel 的角色,现在要扮一点 ARM 的角色。但我们也不是非常开放的,我们要选择战略客户进行授权。现在已经三家采购龙芯 CPU 核做芯片,也就是现在做龙架构芯片的客户已经有四家了。到今年再有几家呢,我估计会有比如二三十家或者几十家来做龙架构,基于我们的 IP 或者我们的指令系统做芯片,也是做生态的重要组成部分。连 Intel 当年都授权了 AMD 和威盛等等,我们也要授些权。我觉得这个成绩也不错,因为越来越多人说我的芯片是龙架构的。
通过市场活动宣传龙芯理念,分别召开了嵌入式、教育、信息化的生态伙伴大会,召开龙芯 3A6000 发布和生态伙伴大会。
刚才是我们 2023 年的市场工作报告,现在报告一下 2023 年研发工作。
首先还是要讲龙芯的研发:我们要掌握根技术,破解卡脖子问题。CPU 和操作系统是信息产业的底座,但是还有更底层的根技术被卡脖子。这里列了信息产业的技术依赖图,像电商、微信、游戏都是应用,应用下面是整机,我们国家这方面做的很好。现在我们开始关注操作系统和 CPU,其实我们做信创就是要自主操作系统、自主 CPU。但是这下边还没到头,比如说 ARM 的 V9 指令系统,有些企业就得不到授权(国内很多芯片企业用 ARM 的 IP 做芯片,它最高端的 Neoverse V 系列对中国是限制授权的)。还有芯片生产工艺和材料设备要禁运。
指令系统、IP 核、生产工艺——龙芯强调将自主进行到底,不依赖技术授权和供应链,强调这三个红的自己做:自主指令系统,自主 IP 核,基于自主工艺进行生产。这三个自主就带来两个问题:一个是性能比得上引进国外的吗?一个是软件生态比得上 X86 和 ARM 的吗?我们在(2023 年)这方面都有很大的进展,在研发方面。
我以前讲过,但作为报告的完整性还要跟大家报告一下:龙芯 CPU 三大产品系列定位。
一个是面向桌面和服务器应用的龙芯 3 号 CPU 系列;
第二是面向工控和终端类应用的龙芯 2 号 SoC 系列(这是 CPU、这是 SoC,CPU 要跟桥片形成两片方案,SoC 单片就形成系统);
第三是面向嵌入式专门应用的龙芯 1 号 MCU 系列(我们做一些专用的 MCU)。
还有配套芯片的研制,包括接口桥片,GPGPU,BMC 等等。这是龙芯的总体的芯片研发布局(三大系列)。龙芯是自主 CPU 里面谱系最全的,各领域都能支持,而且硬件生态也是自我配套,从这个角度来说,我们是唯一的存在。
2023 年及 2024 年一季度研发投入:
总体上 2023 研发投入 5.2 亿,其中有 1 亿左右是资本化,4.2 亿是费用化。2024 年一季度研发投入是 1 个亿左右,同比是下降的。为什么会这样呢?我们的投入基本上稳住了:第一从 2023 年开始,我们实行稳员增效的方针,人数基本上九百多一点,不再大幅增加;要提高研发投入效率。由于 IP、人才积累和上市融资,每年新研芯片从 1-2 款增加到 5 款左右。所以我们总体上是这样的。
2023 年及 2024 年一季度芯片研发进展:
2023 年和 2024 年一季度一共 5 颗芯片流片成功,其中有 3 颗是 2022 年交付流片的:
3A6000 是“三剑客”之一;
2P500 是打印机专用芯片(扫描也能做);
(1D0100) 这是一个流量表专用芯片;
1J0200 是抗恶劣环境高质量等级专用芯片;
2K0300 是嵌入式芯片。
也就是说“三剑客”、“三尖兵”(流片)回来了一个“剑客”一个“尖兵”。
有 3 颗芯片交付流片了:
3C6000 交付流片,它是服务器 CPU,性能翻番、成本减半,它是“三剑客”之一;
(7A2000) 是跟 3A6000 配套的桥片,成倍降低了他的桥片成本。(7A2000) 是跟 (3A6000) 配套的,我们过去提高单核性能,现在强调的不是单个芯片的性价比,是整个系统的性价比,所以对桥片进行了优化,使得它的成本要成倍降低;
1C0203 是电机驱动专用芯片,也是“三尖兵”之一。
我们今年上半年 2K3000 快(交付)流片了,还有 2P0300(预计)6 月份交付流片。今年上半年这两个交付流片的(芯片)(预计)下半年都能回来。所以到 2024 年底之前,我们计划的“三剑客”和“三尖兵”还有其他芯片要都能回来。
因为龙芯强调 IP 自己做,尤其是 2021 年以来,我们有很多的 IP 积累,2022 年、2023 年 IP 积累尤其多。
这是 CPU 核,最近我们还做了一个新的性能更高的(CPU核)。GPU 取得了突破性的进展。还有各种内存接口(PCle3 到 PCle4)、还有显示接口,还有 CAN-FD 工业接口。硬 IP(包括)PCIE、COMBO-PHY、C、GNET PHY(这些内存的 PHY 和 PCIE PHY),要是买别人 IP 来做,没有几百万美元是买不来的。所以我们现在开始攒(芯片),成本最低了。(标)蓝色(的 IP)是 3A6000 里面用了的 IP,(标)红色(的 IP)是 2023 年、2024 年一季度我们新研的 IP。总体上就比较齐了,缺的东西不多了,当然再往新一代工艺还得再研发。
我们强调把自主化优势转化为性价比优势。我们坚持 IP 自主化,通过自主研发提高性能。其实买的 IP 是做不到高性能的:
比如处理器核,自己做性能高;
内存控制器自己做,3A6000 的内存带宽效率是全球最高的(拿 Intel 的、AMD 的 DDR4 3200 来测实测带宽,肯定是龙芯最高)。做 CPU 不做内存控制器,性能不可能高,数和指令供得不够及时;
还有片间互联,片间互联也是降低了延迟;
IP 核的协同,自己做的 IP 才能协同,就像一个单位的同事磨合久了才能协同,否则也没有效率。
所以 3A6000 能够在桌面自主 CPU 中性能领先,(预计)3C6000 也将在服务器自主 CPU 中性能领先。而且我们一般在工艺比人家差一代的情况下,还能够做到性能领先,就是靠自己做 IP。过去我们做 IP,总是比别人慢,现在积累了就可以超过。
成本降低:比如 12 纳米工艺 PCLE,如果买 12nm 工艺的 PCLE3 的 PHY,一个是 0.32 平方毫米,我们做的 PCLE4 也才 0.24(平方毫米),十个服务器的芯片得 100 多路的 PHY,面积省很多。比如 3C6000 16 核((3C6000)对(其他) 16 核亥(芯片)),相同核、相同工艺的自主 CPU,(3C6000) 面积最小。硅片的成本跟芯片面积不是呈线性关系,是 x 的一点几次方的关系,不光是硅面积减少能够降低(成本),而且成品率还可以提高(因为硅面积太大成品率很低)。可以根据灵活需求调整 IP 核。
3A6000 的性能达到市场主流产品水平。我在发布会上去年我在 (3A6000) 发布会上讲:
首先相同工艺下性能比上一代产品大幅提高:单核性能提高 60%,多核性能提高 100%。
跟十代四核酷睿可以比(2020 年的水平,Intel 2020 年发布的(产品)),我们 2.5GHz 跟他 3.6GHz 比,这是实测数据,总体上是高不少的。但是我们要实事求是,强调通用处理性能还是单核的定点分值(最有说服力),这才是通用处理的(浮点都好做)。我们 (3A6000) 43.1 分,他(Intel 酷睿十代四核)43.6 分,我们说性能达到它的水平,依据主要是这个分值(其他分值都比它高,当然这是好的)。
最重要的依据是单核、单线程。我认为 3A6000 在中国信息产业历史上是个里程碑,我们走出了一条基于成熟工艺、通过设计优化提高性能的道路。在相同工艺条件下跟 Intel、AMD 性能相当了(因为我们工艺比人家差一点,可能还会持续一段时间)。就像八路军和志愿军,武器装备不如敌人,但是能打胜仗。我们能不能用相对成熟的工艺达到人家先进工艺的性能?这是一个课题,我们会把这个问题解掉。
我们觉得到 6000 这个阶段,3A6000 通过自主研发完成通用处理性能补课。提高 CPU 性能可以通过设计优化和工艺选代,两种(方式)要叠代着进行。
我们 2002 年推出龙芯 1 号 CPU,是我们国家首款通用 CPU,当时 2002 年 Intel 刚推出奔 4,我们性能大概是它的 1/20。
2010 年开始对龙芯公司进行市场化运作,2012 年推出 3A1000,2012 年 Intel 推出了第三代酷睿,(3A1000) 性能是(第三代酷睿)的 1/10。
3A2000 主频也是 1GHz,工艺没变,性能提升 2.5 倍(这是设计优化)。
工艺升级,主频提高,性能提升 1.6 倍。
然后又是这个工艺,又是设计优化,性能提升 2 倍。
又是升级工艺,性能 1.5 倍。
最近又是相同工艺,优化到 1.6 倍。
3A6000 这杆旗就已经插到了 2020 年的水平。
龙芯桌面和服务器 CPU,我们有个规划,这个规划引用《道德经》里一句话,就是“道生一、一生二、二生三、三生万物”。
“道生一”就是 2010 年到 2020 年期间完成单核性能“补课”。3A1000 到 3A4000,十年只做 4 核,我们宁愿不做服务器,也要把单核性能先补完。
“一生二”,第三代产品 Tick 阶段就是 5000 系列,我们(5000 系列)分成 4 核、16 核、32 核:3A5000 面向桌面,3C5000、3D5000(16 核、32 核)面向服务器。其实我们从 4 核到 32 核也就花了一年半,单核做强了,做多核是容易的,但单核的性能积累花了十几年。
“二生三”就是现在第四代产品 Tock 阶段:3A6000、3C/D/E6000、2K3000,面向桌面、服务器和移动终端。这个我叫做龙芯“三剑客”。我觉得做到“三剑客”时,如果不考虑生态的问题,开放市场可以打价格战。
第二,我们有个调整:过去是 Tock、Tick(结构优化、工艺升级),再基于相同的工艺,结构优化,再基于相同结构,工艺升级。我们这回准备在工艺升级前做 improvement,从结构升级到工艺升级之前,再结构升级优化一代,工艺还不变,再来一代(结构优化),再工艺升级。我们 (计划做) 3B6600(计划)使用成熟工艺达到 X86 先进工艺性能,然后再用工艺升级 (比)谁也不差了。
这是 3C6000,通用性能成倍提高,访存性能提高,IO 性能成数量级提高。我们还支持国密算法,片内支持国密算法。通过龙链技术实现片间互联(因为服务器要多路互联),龙链技术相当于英伟达的 NVLink,也相当于 Intel CXL。我们测了跨片互联,一般(服务器芯片)利用 PCIE(进行片间)互联,这个专门的协议义(龙链)互联,延迟只有 PCIE 的一半,意味着多路效率会提高。用龙链进行双硅片、四硅片封装,这个(技术)很重要。我觉得龙芯对我们国家的标准方面,指令系统是一个贡献,龙链应该是第二个贡献,我们也都会开放。我自己觉得从协议的简洁性来说,比 NVLink 和 CXL 还要好一点,很简洁,再优化一下,延迟还能降低。
具有开放市场的竞争力,我认为是“三剑客”口中最爆款的。服务器有个特点:3A6000,很多媒体本(报道)都知道,龙芯的 3A6000,每 GHz 性能比 X86 不差了,主频还有差距。但在服务器领域,Intel、AMD 的服务器,主频也就是 2GHz 到 2.5GHz(因为功耗是瓶颈),(服务器芯片)每 GHz 性能不差,主频也不差,性能就达到了。而且服务器是 Linux 为主,没有生态壁垒。成本减半,成本我们肯定最低的。(3C6000) 是超强性价比的服务器 CPU。我觉得“三剑客”里边这个可能会是最爆的爆款,因为性能很高,但成本很低(我前面讲了成本低的原因了,我们硅面积就是比别人低很多,封装也做的好)。
2K3000 我们(预计)今年下半(出)样片,我自己觉得它是史上最强的 SoC:CPU 8 核、内存、GPU 2D、3D(这个可是 GPGPU,首先是个显卡,同时是个加速卡),还有 VPU,各种显示,除了 PCIE,还有一些工业的接口,成本也还做的比较低。我觉得这也是超强性价比的 SoC 了。再加上这两个(3C6000、2K3000),“三剑客”就都做完了。
前面讲到的是芯片研发,下边讲我们 (2023) 年的基础软件研发:把自主化的优势转化为软件生态的优势。
首先是夯实基础:要原生支持 Linux 的平台全部主流基础软件和应用环境。
第二,广泛兼容:要把 X86 的 Windows 应用和 ARM 的安卓应用在龙芯上直接跑。
第三,自主应用:就像手机 APP 有安卓版、苹果版,我们希望电脑 APP 有微软版和龙芯版。
我觉得经过 (2023 年)的努力,龙架构在 Linux 桌面方面已经形成对 X86、ARM 的局部软件生态优势。
首先夯实基础:建成跟 X86、ARM 并列的 Linux 基础软件体系。我们知道所有的基础软件上游社区(国际开源社区是最上游的,比如安卓,代码很多来自上游社区,苹果的 iOS 也一样,欧拉也一样,鸿蒙也一样)。比如浏览器,一个浏览器有上亿行代码,不会有人再写一遍了。总体上分几层:上游社区的下一层是操作系统,比如像统信、麒麟、龙蜥、欧拉、开源鸿蒙,都是有些包自己研发(一个操作系统一般几万个包,有些从上游拿来,有些自己研发),操作系统就是把这些包有机的管理起来呈现给用户。操作系统上面有基础应用,像微信、QQ、浏览器、WPS,这些都是基础应用。
我们经过 (2023 年)的努力,已经得到国际开源社区的认可和支持,可以基于龙架构的国际开源软件直接构建出完整操作系统。比如说早些年像欧拉、麒麟、统信支持龙芯的时候,需要龙芯中科的支持(因为我是指令系统的拥有者),他们做 X86 版本的时候不会找 Intel 支持(Intel 不(用)支持他),现在做龙芯的版本也不用龙芯支持。今年上半年以来我们明显感到这方面工作量很少,任何一个人可以基于开源社区的版本完整的构建出龙芯操作系统。我觉得这是我们去年取得的对信息产业的第二个里程碑。
我们得到国内操作系统和基础应用认可:统信、麒麟、欧拉、/龙蜥、开源鸿蒙等操作系统支持龙架构;WPS、微信、QQ、钉钉、腾讯会议、美图、搜狗输入法等基础应用支持龙架构。
我们有一个做 AI 卡的合作伙伴,他把 AI 卡适配了很多国产 CPU,他对我们有这样的评价:说龙架构基于 Linux 的生态(包括开源和闭源,因为像微信、QQ 这些是闭源的)已经跟 ARM 相当,面向信创局部优于 ARM;开源生态完善程度、优化程度远超 RISC-V(因为他都适配过,他的(AI)卡这几个都适配)。
我举个例子,比如说腾讯会议,它的 Linux 版本,我们叫信创版本,它有 X86 版、ARM 版本、龙架构版本。现在信创里边 X86、ARM、龙架构三条路线,一般的软件都支持。
在二进制翻译方面取得了不少进展:通过二进制翻译运行 X86 应用。什么叫二进制翻译呢?就是把 X86 的二进制码拿来直接在龙芯上跑,要架两座桥:一是要把 X86 指令变成龙架构指令;第二要把 Windows 接口变成 Linux 接口(第二座桥更难)。
我们去年推出了龙芯二进行翻译的 RC1 版本,可运行大多数 X86/Linux 应用。我们指令翻译效率从 45% 提高到 65%,也就是说一个应用程序直接翻成龙架构直接变成龙架构跑,和变成 X86 在龙芯上跑,效率损失了 35%,这是一般情况。我们还做了一个库直通:一个应用里边除了有些指令之外,还有很多要调用库的,比如说图形库(玩游戏是要调用图形库),因为做了库直通,库就不翻译了(原来要调 X86 的 (Linux) 库,现在直接调 (龙架构) 的库),效率达到百分之百。所以在龙芯上游戏玩的好,是因为 OpenGL 是不用翻的(图形库不用翻)。
兼容性也有很大提高:
可以在龙芯上运行主流商业 EDA 软件(像我们龙芯用的各种 EDA 软件,我们可以在龙芯(服务器)上设计龙芯,可以直接跑在龙芯服务器上,(EDA 软件)是没有龙架构版本的);
还有大型的(数据库),像 Oracle 数据库,这些都可以在龙芯上直接跑了(这是 X86 的 Linux)。
还有一个是 X86 的 Windows,这个可以运行常见的应用,仍在持续改进。
龙芯打印机驱动破解困扰 Linux 桌面几十年的打印机驱动问题,成为龙架构“一招鲜”特色。任何一个机关、一个部门,要换成信创电脑,打印机是个大问题。用龙芯电脑,用龙芯打印机驱动,95% 以上甚至 98% 以上的打印机就直接就能跑了(如果把你的 X86 电脑 (Windows) 电脑换成 Linux,你也跑不了多少,可能也就 50%)。
典型应用像云视讯、Photoshop、微信、Foxmail、Office2003、IE8 等这些功能达到基本可用水平。龙芯 Linux 桌面软件在局部超过 X86,争取再用一两年时间总体超过 X86。这是一些像 Photoshop、Windows 版微信、魔兽世界、云原神,这些都是 X86 上的游戏/软件,都是在龙芯上直接跑的。但这个工作,尤其是 Windows 这些工作,我觉得还需要一两年的工夫才能做的相对比较透。这个做完以后,把安卓的(应用)也要跑起来。
打牢第三套底座,开启生态建设新征程。经过二十多年的发展,龙芯的 CPU、操作系统完成技术补课:
基于自主 IP 核 (CPU) 性能达到市场主流产品水平;
基于自主指令系统的基础软件生态基本建成;
基于自主工艺可以基本满足自主 CPU 生产要求。
等(龙芯)转型完成,我们重点就要开启生态建设的新征程,要构建独立于 Wintel 体系和 AA 体系的自主信息技术体系。
我画了三个体系:X86 体系、ARM 体系和龙体系。
比如 CPU,有 Intel、AMD,还有国内的一些合资企业;操作系统,除了 Windows,有 Linux,还有开源鸿蒙。
ARM 体系里面,芯片企业非常多(国外一堆,国内一堆);安卓、iOS、鸿蒙和 Linux 版。
除了龙芯,还有好几家其他企业用龙芯 CPU IP 核做芯片了;基于开源类的 Linux 类的操作系统有好几个了;还有一些整机和应用。
整体上这个体系已经有了,但我们的不同之处在于指令系统、IP 核和工艺自主性、自主化程度更强:第一,不依赖 IP 境外授权;第二,供应链可控。
前面是 2023 年的一些工作的报告,下边报告一下 2024 年工作思路。
2024 年是龙芯深化从政策性市场走向开放市场转型的决战之年(2022 年是起步之年)。我们要坚持政策性市场和开放市场“两条腿”走路,贯彻“点面结合”的经营方针,以及“平台为本、品质优先、纵深发展、重点突破”的工作方针。
2023 年之前我们工作方针是“纵深发展、边缘扩张”,我们认为从党政开始往行业慢慢走,能自然的走到开放市场去。但 2023 年我们调整策略,觉得自然走是走不过去的,必须要重点突破,就像刘邓大军挺进大别山,找几个“点”做起来,才能带动整个龙芯走到开放市场去。要是“边缘扩张”做到行业为止,没人帮你往下做了,所有产业链整机企业就会说龙芯就是做信创的,所以我们自己要打出去。这是工作方针的调整。
把自主化的优势转化为性价比和软件生态的优势,大幅提升龙芯通用 CPU 在政策性市场竞争力(这是个“面”)。采取灵活机动的战略战术,在应用比较固定或单一的领域,基于通用 CPU 研制专用服务器及专用终端等解决方案(这是第一个“点”);研制打印机、电动工具、流量表等专用 CPU 芯片,形成开放市场性价比优势,打几场面开放市场的突击战(这是第二个“点”)。
在提高性价比、完善软件生态、重构产业链三个方程式上持续发力。我自己觉得干了那么多年,我们要做第三套生态,要解开三个方程式(解开了就好了):一个是性价比,一个是软件生态,一个是产业链的重构。实现研发和市场迭代进步,政策性市场和开放市场互相促进,迈出构建自主生态的坚实步伐。这是我们的 2024 年的工作摘要。
我们有一个重要判断:2024 年尤其是下半年开始,龙芯发展主要矛盾从产品端转向市场端。以“三剑客”和“三尖兵”为代表的第四代产品具有很高的性价比,我们自己都是认真的跟 Intel 比过性价比的。比如说服务器,32 核的服务器,Intel 的 32 核服务器,我的 32 核跟他性能(比)不怎么差,他可能得卖一两万,我可能比他便宜一半还不止,那就看软件生态。2K0300、1C203、2P0300、1、1D100(有一个流量表芯片),在公共专用领域,性价比在全球都是很领先的(相同性能下跟人家比,不是说提高 10%-20%,而是提高 30%-50%,相同性能下我(的价格)京就是他的一半)。花这么多力气,拿着牛刀来杀鸡,就是想干几个试试看能不能打出来。
龙芯软件生态不断优化,我们希望 2024 年龙芯桌面 Linux 从局部优势到总体优势(包括打印机、浏览器、二进制翻译等等),我们希望形成总体优势(我们已经有局部优势了)。那很多用户说一换电脑打印机扔掉一半,他舍不得扔,打印机能够适配是很多人选龙芯的一个非常重要的理由(几乎能够全适配)。服务器主要基于 Linux,生态壁虽然不高,我们可以通过二进制翻译,然后还有专用服务器(像存储服务器),性价比肯定高。
工控领域继续发挥掌握底层技术的优势,解决问题很彻底。要主动选择市场,而不是被选择。政策性市场充分发挥龙芯安全可靠等级高以及新一代 CPU 高性能、低成本的优势。开放市场选准突破口实现重点突破,像我这里列了一些:我们可能要选择存储服务器、云终端、打印机、流量表、电动工具等,通过解决方案带动芯片销售,通过软硬件定制和重构产业链降低成本。
最后 2024 年,我们一个重要事就是向 AI 进军。可能大家都很关心,龙芯 2K3000、9A1000、3B6600 是 2024 年芯片研发的重点,AI 是重要特色。
龙芯的 GPGPU,它的特点是首先是显卡(英伟达的套路,首先得做图形,然后科学计算加速、AI 加速)。大家看我们这个 GPU 的结构,这里边是计算加速,这一块是 AI 的 Tensor Core(类似于 Cuda Core),中规中矩的结构。但我们现在 AI 主要方向是通用架构下,我们重点是具身智能实现推理的应用(首先这个智能是有身体的,像无人车、无人机这样的,但它做推理为主,训练在后台服务器上做)。这是我们的重点。我们 (AI) 软件生态建设有一个原则:就是兼容主流√拥抱开源、应用牵引、选代发展。重点是围绕三大训练框架、三大推理框架。我很高兴看到三大训练框架有一个是国产的百度飞桨(PaddlePaddle),三大推理框架里面,有一个是腾讯的 NCNN(这是我们国内的基础软件的进步)。还有三大编程模型:Cuda、SYCL 等等。每一个都涉及到编译器、运行时、加速库。除了 Cuda 以外,都有龙架构版本了。
我们 2024 年工作重点:
一个是 2K3000 这颗芯片要回来;
9A1000 要流(片)出去(这里边都有 GPGPU);
3B6600 要代码冻结;
上述软件生态除 Cuda 以外,现在龙架构版本都有了,2024 年要完成三大推理模型(目前这几个主要是面向推理或者你叫 AI PC 也行,反正就是在终端上的)对龙芯 GPU 的支持;
完成 OpenCL 和 SYCL 对 LG200 的支持;
Cuda API 的兼容,也要做起来。
对于龙芯来说,连微软的 Windows 的生态壁垒都破过,这个壁垒不高。我们研究了一下,可能一两年,只要硬件支持好,应该是能做到兼容。
最后就是结束语:基于自主指令系统构建自主可控的信息技术和产业生态,是一条不易走通的路,但走通后前途最光明,对国家人民好处最大。这是一条前途很光明,但是比较曲折的道路,所以这条路走起来很难的。远方也许尽是坎坷路,也许要孤孤单单走一程,但是我们现在不孤单,也感谢各位投资人陪伴着龙芯走完这条路。谢谢大家!