龙芯中科从 2022 年到 2024 年的三年转型计划,称之为“点面结合”和“两点一面”的研发转型。目的是提高产品竞争力,从政策性市场走向开放市场。
欢迎大家参加龙芯中科 2024 年上半年业绩说明会。
我分两大部分:
一个是 2024 年上半年的工作报告,以及 2024 年下半年的工作计划。
从 2022 年到 2024 年,我们实施了三年转型,主要是“点面结合”和“两点一面”的研发转型。希望通过研发转型,
大幅提高龙芯的产品竞争力,能够从政策性市场走向开放市场。
首先,在政策性市场要大幅提高产品竞争力——因为即使在政策性市场,也面临着 X86 和 ARM 这样国际主流产品的竞争。
同时,我们希望在开放市场要有所作为,能够打到开放市场去。
所以,2022 年是我们转型的第一年,2023 年是攻坚之年,2024 年我们叫做决战之年。
“两点一面”是什么意思呢?
第一个“面”就是持续完善基础软硬件平台,大幅提升龙芯通用 CPU 的系统性价比和软件生态。不仅是芯片的性价比,而是整个系统的性价比,还要完善软件生态。
研发的重点是“三剑客”:
3A6000 + 7A2000 CA 版(我们原来有个桥片 7A2000,给它进行改版来降低成本);
3C6000 是服务器的 CPU;
2K3000 是终端用的 CPU。
性价比应该是上一代产品的两到三倍——性能提高加上成本降低,普遍应该在两倍以上。用户觉得龙芯芯片性能提高了,而且价格便宜了。我自己觉得毛利润率也提高了,然后用户觉得便宜了而且性能提高了。希望这个产品有这样的效果,是两到三倍。
硬件生态,要研制和推动 CPU 配套的各种芯片,包括接口桥片、GPGPU(就是 AI 和图形用的),包括 BMC、RAID 卡这样的芯片,来降低系统成本。有些情况下,只把 CPU 价格降下来是没用的,必须跟 CPU 配套的外围芯片要一起便宜,整个系统才便宜。
软件生态我们分三个方面:
一个是夯实基础——龙架构的 Linux 平台要做好;
第二是广泛兼容——在龙芯上,要与 X86 的 Linux 和 x86 的 Windows,甚至 ARM 的安卓应用要能实现兼容;
大量的自主应用适配——就像 Windows 有自己的应用生态,安卓也有自己的应用生态一样。
从这三方面开展工作,这是“面”的工作,也是跟龙芯做第三套生态的目标相符合的。
但是在这个过程中要抓几个“点”:
一个是基于通用 CPU 研制具有开放市场竞争力的专用解决方案。基于 3A5000、3A6000、3C5000、3C6000、2K2000、2K3000 通用 CPU 研制专用服务器,比如说服务器里面的存储服务器——存储服务器在云中心里面,一般会占到一半的服务器的采购量,采购价格也会占到百分之二三十。它没有生态壁垒,只有一个软件,这个软件迁移过来之后就看性价比了。
还有终端里边的云终端,也只有一个软件,生态壁垒也很低。还有一些软硬一体的解决方案,比如说像彩票机,它是软硬一体的;比如说学生高考的阅卷机器、专用的电脑。希望基于通用 CPU 做专用的解决方案,有竞争力。一方面要规避软件生态的壁垒(因为我们不是 X86),一方面要有性价比。这是第一个“点”。
第二个“点”:结合特定应用需求,研制具有开放市场竞争力的嵌入式/专用芯片。就是杀鸡要用牛刀——因为龙芯是做通用 CPU 的,基于通用 CPU 的技术积累,在做低端的芯片方面能不能做到世界上比较领先的、极致的性价比?
我们定义了 2K0300、1C203、2P0300 等嵌入式/专用 SoC 和 MCU,叫“三尖兵”。前面通用 CPU 是“三剑客”,下边专用的 CPU 是“三尖兵”。这 6 款芯片,希望能在开放市场上有竞争力。
专用芯片里要聚焦在打印机、电机驱动、流量表这几个方向,研制具有终极性价比的专用解决方案。像 1C203 是电机驱动的芯片,2P0300 是打印机的芯片。当然还是要保持比较高的利润率,因为成本低。
2024 年我们就处在这样一个年头,这些是 2022 年到 2024 年三年的工作,2024 年是转型的最后一年,是在这样背景下我们开展今年的工作。
下面汇报一下上半年的市场工作。
上半年总体上看是在下降的。
比如说营业收入 2.2 亿,下降了 28.68%;毛利润率也是下降的;扣非的净利润也在下降;净资产收益率、经营性现金流还有每股收益都在下降。
这个我以前讲过:我们最主要的两个发动机——龙芯营收的两个引擎,一个是安全的工控应用,一个是电子政务应用——过去两三年都在“熄火”状态。
我们看营收具体的内部组成的情况。
首先,工控类芯片营收去年 1.1 亿,今年 5100 万,下降了 51.86%,毛利率也有所下降。
主要原因是安全应用领域重要客户由于内部管理的事情,导致高可靠芯片销量临时减少。但是我们在工控领域的其他行业形势不错,待会我还会进一步说明。
信息化类芯片收入是提高的,提高的幅度比较大,提高了 186.98%。我记得一季度我讲过(信息化芯片业务收入我们提高了 123%),我们今年上半年信息化类芯片营收增加是百分之一百八十几,几乎就是三倍,已经超过了 2023 年的全年。
毛利润率也有所提高,但是还不够高。我们正常的毛利率应该是百分之四五十(50% 左右,至少是 40%),目前还不够高。
原因呢?第一,我们去年推出了 3A6000,性价比大幅提升,整机企业销售的积极性也明显提高。整机企业 2022 年、2023 年以来,整机企业芯片的订单一般都是万片、几千片,现在又开始 5 万片、10 万片的订单重新回来了,有点像回到 2021 年之前。
一个原因就是 2024 年下半年电子政务市场开始重启了。我刚才说龙芯过去两个主引擎——一个电子政务市场,一个是安全应用的工控类市场——开始重启了,产业链要为此做准备。去年 3A6000 推出的比较及时。
解决方案营收去年是 1.56 亿,今年只有 0.56 亿,下降了一个亿,毛利润率是增加的。一个原因是随着芯片销量逐步回暖,公司调整销售策略,限制整机型解决方案销售。
我们如果只看芯片的营收(因为这是龙芯主营业务),我们今年上半年(信息化芯片+工控芯片)大概是 1.6 亿,比去年上半年是提高的。我们主要下降的是解决方案收入。
跟大家回忆一个数据:我们公司 2020 年和 2021 年——2020 年我记得营收 10 个亿,2021 年营收 12 个亿——那时候主要是芯片的营收,那时候芯片的营收大概在 10 个亿左右。2022 年、2023 年的芯片营收下降,去年 5 个亿的营收里边只有 50% 是芯片,芯片营收从 10 亿掉到 2.5 个亿。今年上半年芯片的营收开始恢复增长。
我们对销售进行分析:
第一,对工控领域来说,安全应用领域的销售是大幅下降,但是其他工业行业的芯片销售都是快速增加。
这里我列了 1 号系列的 1C102、1C103,2 号系列的 2K0500、2K1000、2K1500、2K2000,还有 3A5000 在工控领域的应用——3A5000 除了在电脑里应用,在工控也有不少应用。(这几款芯片)2024 年上半年的销售额均超过去年全年。这些都是一般的工业级芯片,工控的其他领域增长的还是不错的。
2P0500 是去年推出的打印机主控芯片,推动国产打印机主控芯片自主化。过去我们国家的有关部门在打印机的主控芯片是没有自主化要求的,只要打印机品牌自主化就行。去年龙芯推出了 2P0500 打印机主控芯片,现在有关的领域已经要求打印机主控芯片国产化。有不少送测的打印机企业,送测的全是龙芯芯片的打印机。
专用芯片,我们会把打印机作为重要方向。打印机是一个很特殊的领域:中国所有的整机——各种 PC、服务器、笔记本、手机、包括网络设备——占全球的份额都是 30% 以上的,一般都 50% 以上,至少也是 30% 以上。但打印机的整机占全球的份额只有不到 5%,缺少主控芯片是一个重要原因。所以我们把打印机主控芯片作为龙芯几年前部署做的一个重要的发展方向。
第二个领域,信息化领域芯片销售大幅增加(增加 187%)。有几个理由:
一个原因是电子政务市场 2024 年下半年会重启。我记得上回业绩说明会的时候,有人问我什么时候重启,等发第二期的 CPU 安全可靠名录。2024 年 5 月 20 号有关部门发了第二期的 CPU 安全可靠名录。第一期里面的 CPU 都是三年前的了(我们 3A5000 在里边,那是 2021 年进的名录),2022、2023 年由于电子政务市场有点停滞,所以都没发。我说它就是启动的一个发令枪——三年前的 CPU 跟三年后的 CPU 性能肯定是差很多的,所以很多客户也在等待,新的名录不发就不启动新一轮的采购。那么 5 月 20 号发了新的名录,大家可以到网上查一查,所以我说是新的发令枪。
另外一个原因:过去龙芯信息化主要是电子政务为主,在行业的信息化——比如能源、交通、金融——这些做的比较少,现在开始有一席之地。有些发标里有专门的龙芯的标包(这个包是给 X86 的,这个包是给 ARM 的),我们当然也会竞争获得一些。还有一个一席之地,就是龙芯 3C5000 和 3D5000 服务器 CPU 在信创市场也开始有一席之地。
3A6000 确实是拉动信息化领域的芯片销售收入大幅增长,但是我们早期配套芯片 7A2000 成本偏高。有很多人关心说信息化的毛利润率还是不够高,因为我们早期配套芯片包括研发采购都是 2021 年产能最紧张的时候做的。我们一直说 7A2000 要改版,桥片成本偏高是一个原因,量不够大是另一个原因。
还有一个特征:我们转型以“三剑客”、“三尖兵”为代表的新一代产品,竞争力明显提高,这是我们明显感觉到的。比如说 3A6000 的性价比确实很好,用户体验好,得到产业链和最终用户的较大认可和支持。这是我们“三剑客”、“三尖兵”里边唯一已经量产了的一个“剑客”。
2K0300 是今年 3 月份流片回来的,因为芯片规模比较小,所以迅速的产品化。除了在传统的信创应用之外开始走向开放市场,尤其像珠三角的很多合作伙伴,觉得面向开放市场也有竞争力,就是性价比好。
由于芯片本身的竞争力提高,2024 年一季度营收比去年略增一点,2024 年二季度营收同比是下降的。但是即使总营收下降,2024 年的一季度和二季度,芯片本身的营收都是增加的。
相当于芯片营收铺底。我们很关注芯片的营收,这是 2024 年上半年的销售分析。
下面报告一下 2024 年上半年的研发工作。
研发工作首先要讲龙芯 CPU 的系列:
龙芯 CPU 有三大系列:
龙芯 3 号系列是面向桌面和服务器应用,我们管它叫 CPU 系列;
龙芯 2 号是 SoC 系列,面向工控和终端类的应用;
龙芯 1 号是 MCU 系列,面向嵌入式的一些专门应用。
是龙芯的三大系列。我们的研发有这么几个特点:
第一,要坚持自主研发,不引进任何技术,要构建独立于 X86 和 ARM 的自主信息技术体系和产业生态。建第三套生态是我们的理念。我们要融入国际大循环——我们国家做些 X86 和 ARM,他们负责融入国际大循环是有必要的,像龙芯这样要打造国内的大循环也是有必要的。
我们坚持指令系统自主——指令系统是信息产业的根,也不是 X86、也不是 ARM,我们叫龙架构自主指令系统。IP 核自主研发——现在做芯片里边好多模块,这些模块多数都可以买来,我们坚持不买核心 IP 核。坚持自主工艺生产。
基于三个自主,不依赖于境外的技术授权和供应链,这是龙芯的一个基本的出发点。大家会认为龙芯是最自主的(认为因为龙芯最自主所以性能低所以软件生态差),我相信今天很多人还是这么认为的。但是我们正在把它改变——要把自主化的优势转化为性价比和软件生态的优势。逻辑变为因为龙芯最自主所以龙芯性能高,所以龙芯的软件生态最好。
我相信如果就单核性能来说,因为龙芯最自主,这个结论已经成立了——3A6000 已经体现了。即使是别人的工艺比我们高一、两代,单核性能也不如 3A6000。多核性能也要提高,单核性能要进一步提高,软件生态要变好。这是我们现在处的阶段——要把自主化优势转化为性价比和软件生态的优势。
刚才说了我们三大系列,龙芯是自主 CPU 谱系最全、应用面最广的系列 CPU。我们不用境外技术授权,因此不受授权地域和领域的限制。一般来说比如得到 ARM 的授权,它会给限定是在终端领域用还是在服务器领域用,有些有地域的限制(你只能在中国用)。因为龙芯不用授权,所以我们不受限制,同时我们还可以展开对外授权——比如说对国外的一些企业进行授权,可以用我的 IP 做芯片,或者可以用我的指令系统做你的芯片。
我们要研制跟龙芯 CPU 或者 SoC 配套的芯片来降低系统成本,包括接口桥片,现在在重点做 GPGPU 芯片,包括电源、时钟芯片,这样使得我们的硬件成本最低。
我们的芯片研发,这是龙芯的三个特点。讲一下这三个特点在 IP 核的积累方面:我们今年上半年在做的,这里标蓝的是已经流片了或者流片回来在验证的(因为一个 IP 核的成熟也需要时间)。标蓝色的是我们去年已经做了,在流片、在验证、在测试的;标红色的是今年上半年新展开研发的。
比如说处理器核我们做了 8 发射 64 位的 LA864。每个芯片都是由很多 IP 组成,龙芯的 IP 核要形成长期积累。
才能有性价比。
2024 年上半年研发投入跟去年同比差不多,增长了 3.43%。因为 2023 年以来,我们实施稳员增效的方针,不太大规模扩充队伍了(走一个招一个),要稳住,来降低整个的费用,提高研发投入效率。
研发成本里,因为龙芯的指令系统、核心 IP 核均自研,所以研发投入主要是人员和流片的掩膜版费用为主。当然也有一些板卡的研发投入(因为我们要做开发系统之类的),研发投入主要就是人员成本和掩膜版的费用。只要人稳住了,芯片每年那么多个,所以总体上是稳定的。
第二就是 2023 年业绩不是很好,所以年终奖减少,也是 2024 年上半年研发投入增幅不大的原因。因为即使不涨工资,社保也会涨的,也是研发投入。
所以总体上是稳住了。
2024 年上半年的芯片研发进展是这样的:
首先讲通用 CPU 方面。通用 CPU 有几个原则,有几个思路的调整:桌面、终端、服务器三条线并行发展。我们过去只有一个 4 核的,在单核性能不够高的时候只做 4 核,所以一个 4 核 CPU——桌面是它、笔记本也是它、服务器是它,我坚持了 10 年,我管这个叫“道生一”。5000 系列的时候,桌面跟服务器分开了,我叫做“一生二”。现在桌面、服务器、终端分成三条线,笔记本有专门的芯片,三条线并行的发展,这样来提高性价比。
第二,我们桌面 CPU 内部要集成 GPGPU 了。我们过去的 GPU 是集成在桥片上的,因为不够成熟。我们从 2016 年开始做 GPU,后来做 GPGPU,不够成熟的东西原则上不集成在主 CPU 里边。我们认为现在已经成熟了——我们的 GPGPU 到现在为止也有 8 年的积累了。我们研制配套的桥片,形成自我配套。我们进行了一些调整,技术路线进行一些调整。
今年上半年的研发进展:
一个是 3C6000 流片回来了,是服务器的芯片。它有 16 核、32 核、64 核的版本。一句话,性能翻番、成本减半,性能成本比是 4 倍(因为我得留利润,我们是市场定价,不完全按成本定价)。它是“三剑客”之一,我自己认为 3C6000 是龙芯“三剑客”里边最有出息的。
7A2000 CA 版流片也回来了,它可以成倍降低 7A2000 桥片的成本。它是给“三剑客”做配套的,3C6000 也可以配套。
还有一个 2K3000,2K3000 是终端用的或者笔记本用的,我们交付流片了。8 核的终端 SoC,内置自研的 GPGPU,核数翻倍(过去是 4 核终端,现在是 8 核),成本又被我们减半。它也是“三剑客”之一。
3A6000 已经去年量产了,3C6000 也回来了,7A2000 CA 版也回来了,2K3000 已经交付流片了。
我们今年启动了下一波芯片的研发,是明年要交付流片或今年年底交付流片的芯片:
9A1000 是龙芯首款 GPGPU 专用芯片,它既是显卡又是 AI 卡。你要做 AIPC 一块卡就够了,显卡是它,AI 卡也是它,不用插两块卡,而且自我配套降低龙芯的整机成本。
我们展开了下一代的桌面芯片 3B6600 的研制(为什么不叫 3A7000?因为工艺没变)。我们是 Tick-Tock:Tick 是换工艺,Tock 是结构优化。本来应该在 Tick 换工艺了,我们觉得目前这个工艺性能还没做到头,再做一个 Tock(一般来说叫 improvement)。8 核的桌面 CPU,内部集成 GPGPU,还有 PCIe 接口(过去我们用 HyperTransport 接口,以后不用了),PCIe 接口在主芯片上。性能达到主流产品的先进水平,也就是等它出来的时候,市场上卖的所有 CPU 里边,不管 Intel 的、AMD 的,性能我们应该在前 50%。3A6000 性能达到主流产品水平,那是在后 50% 的,而且比较靠后的。
我们为它配套一个 PCIe 接口的弱南桥。过去龙芯 7A2000 里面集成了 GPU,7A3000 不再集成 GPU 和 HT 接口,通过一个 PCIe 跟主 CPU 接,它就是一个弱南桥。像 Intel 的一个南桥也就是卖十几美元,我们可能卖的比它要便宜一点。通过 PCIe 3 接口带出一些小 PCIe 接口、SATA、USB 这些接口。
今年上半年“三剑客”都流片出去了,开始做这些了。
新的几个芯片——嵌入式或者专用的 SoC 及 MCU,它的特点就是生态壁垒不高,我就要通过自主 IP 做到极致的性价比。我们一般这种芯片都要找个对标芯片,然后把它打开来看它的硅面积,我要保证我的硅面积比它小 30%,就开展做。
2K0300 是“三尖兵”的第一个,它已经今年 3 月份回来,因为它比较简单,很快就处于产品阶段。嵌入式 SoC 极致的工控 CPU 性价比,它是“三尖兵”之一。
还有 1C203 是电机驱动的专用 MCU,它是我们原来有个 1C103 的升级。
还有 2P0300 是 8 月份交付流片的,他是 2P0500 的升级,支持激光打印、扫描、热敏打印。因为打印的芯片要系列化,2P0500 在信创市场里面用,大家如果到开放市场,我认为 2P0300 有极致的性价比。
这是我们上半年的芯片的研发进展。
比如说 2K0300 我们量产了。我们对标了一个恩智浦的和 TI 的芯片,跟它对标来说,性能只有比它高的,功能也至少不差。比如说像 CAN-FD 现在是一个非常大的优势,但是售价肯定会比它便宜很多。这个芯片确实让我们感觉:性价比是商业里面的第一性原理,只要性价比好,很多做开放市场应用的,甚至有些出口应用的,珠三角的很多企业,就开始用龙芯的芯片做解决方案了。
我叫做极致性价比的嵌入式 SoC。
第二就是龙芯 3C6000 服务器 CPU。我们原来 3C5000 做的比较急,有些瓶颈,现在处于样片阶段。单硅片 16 核 32 线程,用 3A6000 的处理器核。我们自己实测跟上一代比(粉的是上一代,红的是我们这一代的),我们一般比处理性能定点的多核的(桌面更加侧重于单核,服务器就侧重多核),性能提高一倍。我们自测达到至强 4314 的水平(它是 10nm 的 2021 年推出的)。
它是双路四路八路的直连,我们有一个龙链技术——算力芯片之间的互联,有点像英伟达的 NVLink。算力芯片互联你不能通过 PCIe 连,龙链技术比起用 PCIe 连延迟至少可以降低一倍。多片互联一定要把连接做好,我觉得龙链技术比 NVLink 应该更简洁更高效。
我们有 3D6000(3C6000/D)两个硅片连接在一起的,对标了至强的 6338。这个芯片也是 2021 年推出来的,我们分析 Intel 的报表,2023 年这个芯片开始上批量(2021 年推出来 2023 年占销售额的一定的比例),我们已经达到这个水平。
我们还有一个叫 3E6000(3C6000/Q),是 4 硅片 64 核的,还在封装过程中还没回来,所以我们也没有新的数据。
3C6000、3D6000、3E6000 我们统称叫 3C6000 系列,他们都是用相同的硅片,用 Chiplet 技术芯粒技术封装出来的。单硅片封装我们叫 S,双硅片封装叫 D,这个名字以后我们会混着叫。比如 3C6000/Q 就是 3E6000,3C6000/D 就是 3D6000,3C6000(3C6000/S)代表 16 核,3D6000(3C6000/D)代表 32 核,3E6000(3C6000/Q)代表 64 核。因为同样的硅片封装,所以我们也叫 3C6000 系列,有时候就混着讲了。
它还有一个重要特点是内置了安全模块,国密算法大于 30Gbps,外边你不用密码机了,性能足够快。在执行国密算法的时候,这些都是自测数据,最终我们会以第三方权威机构测试为准。主要是因为 3E6000(3C6000/Q)这个没回来,都回来之后一次送测,等它回来之后,我们估计九、十月份回来。
然后我们一起送测。
我认为这个芯片的特点就是超强性价比——它是服务器 CPU 超强性价比。我们知道服务器 CPU 卖的都很贵,龙芯因为 IP 核自己做,硅面积做的比别人小,加上封装也控制得好,所以我们成本低。我觉得跟市场主流的比,相同性能下争取价格只有它的一半。服务器的生态壁垒不高,因为都是 Linux,我们觉得“三剑客”里边 3C6000 很有希望。
一般来说从样片到产品化需要 9 个月到一年的时间,预计真正量产的时候可能是明年二季度或者明年下半年了。
现在已经有样片了。
另外就是 2K3000。2K3000 还有另外一个名字叫 3B6000M——8 核的用于笔记本,应用在笔记本里边就是 3B6000M,在工控里边就叫 2K3000,两个名字混着叫的。
2K3000 的指标:比如说 8 个处理器核,单核性能跟 3A5000 相当;它集成了第二代 GPGPU 支持 2D、3D 图形;支持 AI 的加速,有 8T 的 AI 算力,支持高清……
还有 RapidIO 等等。这个芯片我觉得在高性能的 SoC 里边,性价比也是比较极致的。
3C6000 跟 2K3000 这个是已经交付流片了,我觉得性价比都是做的比较好。我们过去一味的提高单核性能,现在开始非常强调性价比。
我们上半年在展开的 3B6600 属于研制阶段。
首先是明确用 8 发射了,内置 GPGPU、DDR5、PCIe 4、HDMI 2.0。
比 3A6000 同频性能提高 30% 左右——这是我们流片前的评估结果。当然,流片前的评估结果不一定准,要等芯片出来测试。
如果这个真的上去了(每 GHz SPEC CPU 2006 int_base),应该是 22 分到 24 分,处于世界领先行列。什么叫领先行列?我们龙芯跟苹果在争谁是第一名——每 GHz 的性能,其他的应该都在我们后头,而且中间有点差距,第三名跟前两名的差距还比较大。
大家知道苹果的 M1、M2 处理器,每 GHz 的性能它真的是当得起“遥遥领先”这个词——它每 GHz 的性能我们测出来达到 二十三、四分。下边第二档就是 ARM 的 19 分,X86 的在十六、七分。如果我们真的达到增长 30% 实测数据,我们也可以达到 20~24 分,真是做到了就是处于世界领先行列。
我们不能靠工艺——我们没有很先进的工艺可以用,我们就得靠提高效率。我频率没有你高,但我的每 GHz 性能要比你高,只能这么打。主频争取 2.5GHz 以上,掌握单核睿频技术。单核睿频技术,就是说在一定时间内,我就把一个核的主频提高,把所有的电都给它用。一般来说主频可以提高 20%。像 X86 的桌面 CPU 都用单核睿频技术。
如果能够睿到 3GHz,电压提高一点——因为它会提高电压。Intel 我看睿频最多,那 7nm 的工艺睿频都睿到 1.5V。1.5V 的电压太高了,我们一般睿到 1.2V、1.3V 或者 1.25V 就不错了。如果单核能够达到 3GHz(不是 4 核同时达到 3GHz),一般 X86 也是这么干,就是单核睿频。
如果这样的话,实测性能不管是单核还是多核,性能都达到中高端酷睿 12、13 代的水平。
这里有个图是 Microcomputer 刊物,龙芯获了一个奖,就是给国产科技特别贡献的金奖(Microcomputer),画了龙芯的性能提高过程,画了 X86 的性能提高过程。我们注意到这个跳跃:Intel 是从 14nm、10nm 跳到 7nm?因为 Intel 从第六代酷睿开始,就 14nm、14+、14++…一直在 14nm,后来到 10nm。但 Intel 在这个地方有个台阶的跨越,就是因为他突破了他的工艺技术。
我们不靠工艺,靠设计。如果这个 33% 提高了,单核睿频提高上去了,我们觉得可以达到中高端酷睿 12、13 代水平,而且超过了当时市场销售的 50% 以上的桌面 CPU——就桌面 CPU 中高端了。
这个刊物对我们的 3B6600 SPEC CPU2006 评分估计接近 60 分,也许他有点低估了,我们争取达到 60 分,这是我们努力的方向。市场上接近这个性能的芯片不多了——Intel 5GHz、6GHz 的芯片是有 70 分的,但 5GHz、6GHz 的产品到底是少,笔记本里面多数都是 3GHz、4GHz。
我们希望能够走向桌面 CPU 开放市场。我们增加了 x86 二进制翻译的指令,我们要跟 Windows 兼容的话,指令的翻译要对应性比较好。我觉得这个电脑翻译后直接运行 Windows 也应该比较流畅了。
给它(3B6600)一个标签,就是使用成熟工艺达到国外先进工艺的 CPU 性能。我经常讲就像我们的红军和八路军还有志愿军,武器装备都是不如对手的,但是要打胜仗。我们要承认工艺是有差距的。
但是我们的性能不能差。
我们还有一个 9A1000 GPGPU,处于研制阶段,是我们首款 GPGPU 显卡,对标一个不是很高端的显卡。因为我们这款芯片要强调——用它做的显卡就卖两三百块钱,不能做太贵。我们 9A2000 就会做到中高端显卡的性能,因为这就是堆晶体管。像这么规整的东西就是堆(晶体管),这就是图形专用处理的——这部分就是图形处理的、科学计算的,这个就是 AI 处理的,都规整的,就往那儿堆就行了。当然面积不能做大。
兼容 OpenGL 4.0、OpenCL 3.0 这些标准计算,集成了视频处理等等,有 32T 的推理算力。在很多的场景里边几十个 T 是最常用的。(预计今年)年底(明年)年初能够交付流片。
这是我们首款显卡和 AI 加速卡共用的 GPGPU 芯片。
前面讲到的是芯片研发,下面介绍软件生态建设的进展。
软件生态(建设)分三部分:
建成与 X86、ARM 并列的 Linux 基础软件体系——这个已经做完了,处于常态化维护阶段。(夯实基础)分三个层次:上游社区、操作系统、基础应用。可基于国际开源软件构建出完整的龙架构 Linux 操作系统。我自己认为我们 LA 架构的上游社区的软件生态的丰富程度,至少不比 RISC-V 差了。
操作系统,像统信、麒麟、欧拉、龙蜥、开源鸿蒙、Debian 等都支持龙芯了。
基础应用,像 WPS、微信、QQ、钉钉、腾讯会议、Codesys 等,这些都支持龙芯了。而且我们做到了兼容性——因为 Linux 不兼容导致生态碎片化,(我们)实现不同版本和分支 Linux 的应用兼容。这个属于常态化维护阶段,当然我们每年还是有工作的。
广泛兼容,通过高效二进制翻译运行 X86 及 ARM 应用——X86/Linux 应用和 X86/Windows 应用(我们)要兼容,这是目前的工作重点,也取得一些进展。
自主应用,发展自主应用生态——要做自主编程框架。就像手机的 APP 有安卓版和苹果版,电脑的 APP 也要有微软版和龙芯版。
我希望未来达到这样一个状态。
今年上半年做了哪些工作呢?
第一,继续常态化维护和优化龙架构的上游开源社区和基础版操作系统。今年上半年我们看到一个很好的迹象:由于上游社区已经全面接纳龙架构,2024 年的上半年,龙芯团队对国内操作系统企业的支持工作量降低 50% 以上。过去那么多国产操作系统——统信、麒麟、欧拉、龙蜥、开源鸿蒙都需要我们去支持,现在多数不用我们支持了,直接从开源社区就来了。
因为桌面操作系统一般用比较新的版本,欧拉和龙蜥服务器操作系统他们用开源社区一般都是用比较老的版本(可能好几年前的),好几年前的版本对龙芯的支持还不够,还没有支持龙芯,所以我们还有点服务工作量。但我觉得随着时间推移,再有一、两年,他们构建龙芯的操作系统就像构建 X86 和 ARM 的操作系统一样,不用我们太多支持。所以这是一个比较好的转折。
还做了像 Linux 内核、GCC、LLVM、Rust、Go 等上游社区对龙架构最新特征的支持和完善——这个工作是持续的。Alpine、Debian 等操作系统社区开始构建龙架构版本,而且比较完善了,可能在后续新节点正式发布龙架构版本。
以 Debian 为例,Debian 操作系统有几万个包,它有一个非常严格的原则:它的所有的包不接受我提供的,它只从上游社区抓取包——它所有的包必须从上游社区抓取,我们提供的它不要。所以必须是所有的上游操作系统上游社区、浏览器、编译器(等)都接受了龙架构,它才能构建出来。现在我们就等时间了,(已经)满足它的要求了,就等着它的下一个大节点,它会发龙架构正式版本。我们整个的社区建设就真的处在维护状态了。
第二,我们推出 Loongnix 发行版操作系统。Loongnix 过去是基础版,过去要通过 Loongnix 这个平台支持国产的操作系统,现在他们都从上游社区取得支持,它(Loongnix)已经完成了作为龙架构上游的使命。我们要从基础版到发行版,也就是说白牌操作系统,用户如果有需要可以直接用,不用花钱去买龙架构版本。我们今年发行的桌面的发行版操作系统,完善了很多支持,还要持续完善。
第三,是算力和 AI 软件生态构建取得实质性进展。算力和 AI 软件生态是龙架构基础软件最后一块“拼图”,我们前些年把云、大数据这些都“拼”完了。我们去年下半年开始构建 AI 的软件生态,制定了几个原则:兼容主流、拥抱开源、应用牵引、迭代发展。
什么叫应用牵引?我们优先构建面向具身智能应用的推理类应用软件生态,比如说无人车、无人机——智能是有身体的,它不是训练用的,它是推理类的。一般来说大模型是没有身体的,具身智能这种坏了要买新的芯片。
对龙芯来说软件生态是两方面的支持:一是它得支持龙架构(我们不是 X86,也不是 ARM,如果 X86/ARM 你不用做了),同时要支持龙芯的 GPGPU——龙芯 GPGPU 也有自己的指令,不是英伟达的指令,也不是 ATI 的指令。
我们上半年完成了 OpenCL,还有很多推理软件对龙架构的支持,已经完成了。
二进制翻译取得突破性进展:X86/Linux 应用日趋成熟,X86/Windows 操作系统及应用也取得了很大的进展。
二进制翻译大家都很关心,我给大家再报告一下进展:
在龙芯的 Linux 上运行 X86 的 Linux 应用,已经推出 RC1 版本。它可以在龙芯上运行主流商业 EDA 软件、Oracle 数据库等复杂 X86/Linux 应用。
效率怎么样呢?指令翻译效率 65%,我觉得最终仅软件优化可以达到 75%,再加些硬件的适应争取达到 80% 以上。另外还有库直通——比如说你要玩游戏,大量的调一些 OpenGL 的库或 Vulkan 库,这些是库直通的,直接调用龙芯的库而不是调用 X86 的库,这(部分效率)是 100%,所以玩游戏反而(翻译效率)好。为什么呢?因为游戏里边图形库很规范,调 X86 和调龙芯的库是一样的。
(LA/Linux)运行 X86/Windows 应用取得较大进展,仍在持续的改进。打印机是我们一个特色——很多打印机都没有 Linux 的驱动,即使是 X86 装 Linux 有一大半打印机也是跑不了的,这个问题我们已经解决了。后续扫描仪、高拍仪、Ukey 这些都要做好。
另外龙芯浏览器——我们很多应用是基于浏览器做的,如果用 Linux 的浏览器,很多网银包括工商网银你都上不了。我们的浏览器要做到跟 IE 的兼容性好,这样的话直接用户应用就不用改。这两个是成为龙芯的特色了——在 Linux 平台上比 X86 还好。我们直接在上面跑的一些应用也是可以的。
但是这个工作量巨大,不仅要把 X86 指令翻过来,而且要模拟出整个 Windows 的环境。所以我们今年上半年二季度开始做了新的调整,(计划)直接先把 Windows 跑起来再说。我觉得 Windows 7 相对比较流畅,到今年三季度 Windows 7 在 3A6000 上应该很流畅,Windows 10 争取到年底跑得也比较流畅。
直接跑 Windows 是对我们来说是容易的——X86 指令就两三千条翻过来就行。但不跑 Windows 跑 Windows 应用,这个难度挺大的,要模拟出整个 Windows 接口来,应用是全兼容的,然后安全性当然不如直接跑应用好。我们进行了增强,性能要优化。
ARM 的安卓应用将结合需求开展研制,都需要点时间。这个容易,RISC 对 RISC,而且安卓的还是开源的。我们最难的还是要 X86/Windows 应用兼容。但现在我们也发现很多就直接跑 Windows 了,我们也不妨跑一跑。真要用户用 Windows,我也能跑,至少得有,让用户有个选择。
我觉得到今年年底,X86/Linux 应用和直接跑 X86 的 Windows 以及它的应用应该都能告一段落。
下面报告一下 2024 年的下半年的工作计划。
首先我们自己判断:2024 年下半年对龙芯是非常重要的——“三期叠加”。
首先(今年)是我们 2022 年到 2024 年三年研发转型的攻坚期——“三剑客”和“三尖兵”,两个已经量产了,紫的(3C6000)是样品阶段了,蓝的(2K3000、1C0203、2P0300)已经交付流片,等着回来调试。要尽快完成全面产品化并推向市场检验。一般来说从样品到产品需要 6-12 个月,比如说像小芯片 6 个月足够了,像大芯片 12 个月是正常的,那还算快的。
龙芯销售新一轮增长的启动期——龙芯销售收入在经历 2022、2023 年两年的萎缩,芯片销售大幅下降。今年上半年大家看到销售收入也是下降了,但是我自己分析芯片销售都在提高,芯片的销售收入是提高的,所以我觉得内因是在增强的。我判断 2024 年下半年开始重新进入增长周期,这个增长周期起来我希望会持续 5-10 年——这种持续的增长,提高产品竞争力的结果,也并不完全太依靠政策性市场。
首先几个原因:产品竞争力是第一的。3A6000 拉动了 2024 年一季度、二季度芯片营收均是同比增长的——要没有它(3A6000)我们还会下降。2K0300 确实开放市场关注度很高。3C6000 现在虽然只是样片阶段,ODM 企业、整机企业比较积极。我们讲大概的性能,未来大概的售价,我明显感觉到他们积极性比较高,因为(3C6000)性价比高。
另外一个市场领域在扩大——我们过去是安全的工控应用和电子政务两个主引擎,刚才介绍了在重新启动。过去龙芯 2020 年、2021 年业绩比较好,这两个主引擎发挥了很大的作用的。过去我们服务器做得很少,关键行业应用、开放市场以及海外市场这些新引擎也在启动。
我们自己判断,今年下半年开始是进入新一轮销售增长的启动期。龙芯从 2010 年开始正式的产业化运作,2010 年、2011 年、2012 年、2013 年是下降的,2014 年开始一直增长到 2021 年,然后 2022 年、2023 年下降。今年我们争取下半年要进入一个新的启动期。
第三,是龙芯发展的主要矛盾从研发端向市场端的转换期。随着龙芯产品性价比的不断提高——性能成本比比上一代产品提高三倍以上,“三剑客”“三尖兵”性价比(较老产品提高)2-3 倍,性能成本比都是三倍以上(这是稍微有点区别的)。软件生态不断完善,Linux 平台跟 X86、ARM 就可比了,二进制翻译要破除 X86/Windows 的指令系统壁垒。
龙芯发展主要矛盾将从产品研发端转向市场销售端。我们要加大销售端投入力度,要调整销售端的市场关系。对我们来说,更有竞争力的产品是生产力的进步,如果生产关系不调整,销售也会增长慢的。(生产关系)包括灵活的价格体系、渠道的建设等等,要实现新质生产力的发展。
这三个“期”(叠加),今年下半年处于这个“期”,明年也是处于这个“期”。2K3000(预计)年底才能回来,产品化是明年的事了。我们觉得今年下半年和明年,龙芯都是“三期叠加”。今年下半年是攻坚期,新一轮增长的启动期和主要矛盾转换期是在 2024 年下半年开始,大头在 2025 年。
这是我自己的判断。
研发计划:
一方面要做好“三剑客”“三尖兵”等新一代产品的调试和产品化工作。有两个已经量产了,有两个处于样片阶段——3A6000、2K0300 已经量产,要解决使用中的问题;3C6000 和 7A2000 CA 版处于样片阶段,要抓紧产品化和量产工作,有些要大量的测试,如果发现有问题还得改版;2K3000、1C0203、2P0300 已经交付流片了,(预计今年)年底(明年)年初回来,要做好调试工作。
第二,全面开展 2025 年深化转型阶段下一代产品研发。我们 2022-2024 年三年转型,2025 年深化转型,下一代产品研发,再走上正常的发展阶段。
9A1000 是龙芯首款显卡+AI 卡 GPGPU 专用芯片,年底要代码冻结、基本完成物理设计——春节前后,阳历年或者阴历年前要做完。
7A3000 是 PCIe 接口低成本弱南桥,年底要代码冻结。7A3000 只要在 7A2000 CA 版上裁剪就行了,把 GPU 裁掉、显存接口裁掉、HyperTransport 接口裁掉,留下一些必要的接口,也要基本完成物理分析。
3B6600 高性能 8 核桌面 CPU,2024 年底代码基本冻结,物理设计全面展开,争取在明年上半年(时间)靠前一点流片出去,明年年内要回来完成测试。
还有一个工作,就是我们要开展下一代先进工艺的评估和全定制模块的研制。我们会基于性价比和安全性原则选择下一代先进工艺,现在基本选定了。
龙芯强调 IP 自己做,我们正式的芯片流片前——产品芯片流片前,我们大概需要一年半左右的时间,要开展全定制模块的研制,像锁相环(PLL)、多端口寄存器堆、DDR5、PCIe 5、HDMI 2.1 等 PHY 的定制。我要花一年多的时间定制,然后测试片流片流完,保证这些模块是好的,才在产品(芯片)里面用。
所以龙芯跟其他队伍不一样——如果这些 IP 都是买的话,把 3B6600 做完马上就能用新买的 IP 再流片,可能一年就够了。龙芯引入一个新工艺需要两三年,一旦引入之后性价比就很好。像锁相环(PLL)、多端口寄存器堆,我们现在已经开始进行研制了。
基础软件研发计划:
一个是常态化维护和优化龙架构的开源社区——在上游开源社区完善和优化对 3A6000、3C6000 等最新芯片和桥片的支持。与 Debian、Alpine、龙蜥、欧拉等操作系统社区紧密合作,发布和优化龙架构版本。这个常态化的工作也不少。
持续推进发行版龙芯的 Linux 桌面/工控终端操作系统——桌面、服务器(操作系统)。首先持续完善和优化基于国际开源社区的 Loongnix 发行版(桌面、服务器)。另外就是要完成龙架构版鸿蒙操作系统的研制,包括方舟编译器运行时、系统基础库、GPU 驱动等优化。这个(做起来)快,因为它基本上也是 Linux 体系的、安卓体系的,对我们来说开始干了。
在工控终端里,包括对鸿蒙操作系统,觉得在工控终端(领域)对龙芯还是很有必要的,所以我们要把它做起来。也不排除未来基于它做桌面,也就是说可能跑鸿蒙操作系统,因为它有一个特性就是说保持应用兼容——因为 Linux 是升级后不保证应用兼容的。如果我们维护好保证自己应用兼容,同时二进制翻译都能跑。这是今年下半年的工作。
结合龙芯自研 GPGPU 开展 GPU 驱动和算力框架的研制。我们再强调一下:我们在通用的架构下,我们 GPGPU 架构做训练、推理都是行的,先面向具身智能实现推理类应用,完成第一代龙芯算力芯片(2K3000、9A1000)的系统验证和软件栈产品发布。
我们这个算力框架,上半年主要工作是迁到龙架构上去,推理类应用基本完成。下半年要把龙芯的 GPGPU 算力的加速要把它做起来。
争取应用兼容性平台研发取得决定性进展:在龙芯平台上运行 X86/Linux 应用比较完善,拿来就能跑,而且性能还挺高;运行 X86/Windows 操作系统要流畅,至少 Windows 7 要比较流畅。
市场计划:
龙芯发展主要矛盾开始从产品端转向市场端。以“三剑客”和“三尖兵”为代表的第四代产品具有很高的性价比,我们要主动选择市场,而不是被选择。基础软件夯实基础已经没问题了,广泛兼容下半年会取得实质性进展(尤其跟 X86 的 Linux 和 Windows 的兼容),自主应用原生应用也是在稳步推进。
还是“两点一面”:
“面”是政策性市场——充分发挥新一代 CPU 高安全可靠等级、高性能、低成本的优势。电子政务信息化、安全工控应用两个主引擎正在恢复(正在恢复不会一下子就恢复到比如说 2021 年这样水平),但我们明显感觉到恢复的力量了。积极进取“关基”行业信息化和工控市场。
要做好 3C6000 系列服务器产品化和产业链建设工作——现在已经有不少整机企业和 ODM 企业基于 3C6000 做主板,他们要把一个服务器产品做稳定也需要一年时间。(服务器)比 PC 要难一点,大半年或者一年要把他们支持好。
做好 2K3000 终端产品化和产业链建设工作——我们已经交付流片了,意味着它的封装已经定了。现在有些笔记本企业已经基于 2K3000 未来的即将要回来的封装的芯片,已经开始做笔记本的板卡了。这些都要支持好。
第一个“点”:基于通用 CPU 研制具有开放市场竞争力的专用解决方案。
基于 3C6000 的存储服务器——我们觉得很有性价比优势,只要软件不是壁垒,性价比优势就很强。
专用终端不断完善——2K2000、2K3000 专用终端解决方案的性价比(2K3000-流片还没回来),等它回来之后,像云终端、行业终端也是软件生态壁垒很低的,就主打性价比,争取有性价比的优势。
第二个“点”:推进新一代嵌入式/专用芯片开放市场应用。
2K0300 性价比确实很有优势,跟同类芯片比,积极推进它在政策性市场和开放市场的应用——政策性市场也很喜欢(2K0300),又便宜又好用;开放市场也开始有竞争力。
基于 2P0500 的打印机产品预计下半年开始批量销售——现在在测名录,进名录之后就有批量销售。(2P0500)的升级版 2P0300——名字比它小,性能还是高的,但 2P0300 成本比 2P0500 低很多,要开始研制基于 2P0300 的解决方案。
基于龙芯的 MCU 研制智能门锁、无刷电机、流量表等解决方案,带动芯片的批量销售。
这是下半年我们的市场计划。
我就跟大家报告这么多,谢谢大家。