寒武纪深度:天才兄弟的商业化之路
作者:大宇;来源:X,@BTCdayu
一只鸟单脚伫立,白眼朝天,画面几乎全是空白。这样的一幅画,在2010年创下画坛纪录,以6272万元成交。这是八大山人朱耷的《孤禽图》,八大山人是明宁献王朱权后人,明亡之后出家为僧,他笔下不少禽鸟从此都是这副姿态:和别的鸟不同,极具特色。
寒武纪也是芯片股中很特别的一只。
之前我一直没有好好看过它,不是没注意到,而是被它的市盈率吓退过,一只市值快八千亿的票,过去十几个季度大部分都在亏损,市盈率显示出来要么是负数要么是几千倍——要几百年才能赚回来?
当然,对于这种增长型企业,看市盈率甚至可以说是错误的方法,还是要回到项目本身:寒武纪是做什么的?它要到哪里去?
一、从中科院到"AI 芯片第一股"
1、陈氏兄弟:你在江湖,我在学院
寒武纪的故事,要从两个江西兄弟讲起。
哥哥陈云霁,1983 年生,9 岁上中学,14 岁考入中科大少年班,2002 年进入中科院计算技术研究所硕博连读,成为传奇芯片"龙芯"的核心架构师之一。
弟弟陈天石,1985 年生,几乎复制了哥哥的升学路径——中科大少年班、中科大计算机软件与理论博士,2010 年起在中科院计算所工作。
兄弟俩差两岁,两人的学术轨迹和性格分工,决定了寒武纪后来的样子。
陈云霁偏架构、偏理论,做"龙芯"那几年就在芯片设计的最底层钻进去;陈天石博士做的是人工智能算法,是软件那一边的人。一个懂硬件、一个懂算法,又是亲兄弟,能凑到一起做"专门给神经网络用的处理器芯片"这件事,本身就是稀缺组合。
这个想法他们 2010 年前后在计算所内部一次汇报里第一次提出来。当时既不被学术界看好(深度学习还没火,AlexNet 引爆视觉是 2012 年的事,AlphaGo 是 2016 年的事)、也不被工业界关心(全球都没人买这种芯片)。他们坚持做了下来。2014 年,团队发表的论文 DianNao(电脑)和 DaDianNao(大电脑)拿下了计算机体系结构顶级会议 ASPLOS 和 MICRO 的最佳论文,据公开报道,DianNao 是中国科研机构首次在计算机系统和高性能计算顶会上获得最佳论文,DaDianNao 是 MICRO 历史上首次由美国以外国家斩获最佳论文。
2015 年团队成功流片世界首款深度学习专用处理器原型,2016 年公司正式成立。名字取自地质学上"生命大爆发"的寒武纪时代,寓意人工智能即将带来一场计算架构的大爆发。
公司成立后,弟弟陈天石下海当 CEO(截至 2025 年末持股 28.35%),哥哥陈云霁继续留在中科院计算所做研究员。中国科技商业化的故事里,这种"哥哥留在学院、弟弟下海经商"的安排几乎独此一份,通常的剧本是核心团队全部出来一起干,留人的反而是非主流。
但这个安排的客观结果是:寒武纪从第一天就有一只脚牢牢踩在中科院系统里,论文和专利源源不断从那一边来;商业上的失误又不会同时折损学术那条根。
学院派的出身决定了它后来的很多选择,技术上更激进、不愿意走兼容路线、专利数量多得惊人(截至 2025 年末累计申请 2846 项、获得授权 1734 项)。
2、高光坠落
2017 年是寒武纪的高光时刻。
这一年华为发布麒麟 970 手机芯片,集成了寒武纪 1A 处理器 IP。麒麟 970 装在 Mate 10、P20、荣耀 10 等爆款手机上,全球出货量上亿。寒武纪一夜成名。那一年它顺利拿到联想、阿里巴巴等的 A 轮投资(科大讯飞为更早的天使轮投资人),估值飙到 10 亿美元。当时它98% 以上的收入都来自华为海思。
2018 年 8 月 31 日,华为在 IFA 柏林展上发布麒麟 980,这颗芯片继续集成了寒武纪的 1H 双核处理器 IP,表面看一切照旧,但华为内部的"达芬奇架构"NPU 已经在路上。
真正的转折发生在 2019 年 6 月 21 日。
华为发布麒麟 810 中端芯片,首次用自研达芬奇架构 NPU 取代寒武纪 IP,这是麒麟系列第一次不再用寒武纪。三个月后的 9 月 6 日,麒麟 990 旗舰也切到达芬奇,整个麒麟系列彻底告别寒武纪。寒武纪招股书显示,2019 年 IP 授权业务收入同比下滑 41.23%,第二年继续下滑。
寒武纪的客户集中度问题不是新事,从第一天起它就在踩同一个坑:单一大客户喂大、单一大客户突然撤走,它解释了寒武纪后来八年为什么一直在亏损。因为这一波转向之后,公司被迫从"卖 IP"转向"卖芯片",这是两种完全不同的商业模式:卖 IP 是轻资产、纯利润;卖芯片要砸研发、流片、备货、做生态,每一步都烧钱。
从 2017 年达到顶点到 2019 年 IP 业务断崖式下滑,过渡期不过两年。这种"温水煮青蛙式"的客户迁移,对一家公司的杀伤力,并不比直接断供小。
但这件事其实没有任何道德可议,业界有能力做内部芯片的客户,大多都会做内部芯片——包括我写过的端侧AI的研报中列举了很多汽车企业的自研芯片,都有类似之处。
3、一线生机
2018 年华为开始转向自研后,寒武纪加速自研芯片,陆续推出思元 100(2018)、思元 270(2019)、思元 220(2019 年发布、2020 年规模出货)。2020 年 7 月 20 日在科创板上市,发行价 64.39 元,开盘价 250 元,市值千亿,但公司当时仍在亏损。
接下来三年是寒武纪最艰难的时期。
美国当地时间 2022 年 12 月 15 日(北京时间 12 月 16 日),寒武纪与长江存储、上海微电子等 36 家中国科技企业一起被美国商务部列入实体清单。原本承担其先进制程代工的台积电不再为它服务,公司被迫转向中芯国际。实体清单和随之而来的供应链切换,叠加客户项目节奏变化、需求结构调整,共同造成 2023 年云端业务收入大幅下滑。同期公司年营收只有 7-8 亿,亏损 8-12 亿,市值从 2020 年上市的千亿,到 2022 年最低 200 亿,跌幅接近 80%。
那段时间市场上很多人把它判定为故事股、要凉。
转折点出现在 2023 年下半年。这一年公司发布了思元 590,第一款真正能"用"的云端训练芯片,性能是英伟达 A100 的 80-90%。同时国内大模型爆发,DeepSeek、通义千问、Kimi、豆包接连推出,算力需求井喷。再加上美国对英伟达的出口管制层层加码(A100、H100 禁,H800 禁,H20 受限),国内客户被迫转向国产芯片,寒武纪刚好赶上。
2024 年第四季度,寒武纪上市以来首次实现单季度盈利。2025 年全年营收 65 亿、归母净利润 20.6 亿,首次实现年度盈利。
一个从中科院走出来的学院派团队,被实体清单打到 200 亿市值,又被 AI 浪潮拉到接近 8000 亿市值。
二、AI芯片赛道全景
1、AI 芯片的两条路
AI 芯片这个赛道,全球范围内分成两条主要技术路线。
第一条是 GPGPU(通用图形处理器)。这是英伟达走的路。GPU 本来是用来做图形渲染的,2006 年英伟达推出 CUDA 之后,把 GPU 改造成可以做任何并行计算的"通用计算器"。AI 训练、科学计算,只要是能并行的活儿都可以丢给 GPU 做,AMD 也是这一派。
这一派的优点是通用性强、生态成熟,一份 CUDA 代码可以用在所有英伟达的卡上。缺点是专门做 AI 不够极致,既要支持图形又要支持 AI,硬件资源会被分掉一部分。
第二条是 ASIC/DSA(专用集成电路 / 领域专用架构)。简单说就是"专门给 AI 设计的芯片",砍掉所有图形渲染相关的东西,把硅片面积全部用在矩阵运算上。谷歌的 TPU 是这一派的祖师爷,华为昇腾、寒武纪、阿里平头哥、百度昆仑芯都是这一派。
ASIC 的优点是性能能效更好,同样面积的芯片,AI 算力能比 GPGPU 高一截。缺点是通用性弱、生态要从零搭,你不能拿一份 CUDA 代码直接跑,必须重新适配。
这两条路没有绝对的优劣。如果 AI 算法每年大变(十年前 CNN、五年前 RNN、现在 Transformer),那 GPGPU 的灵活性更重要;如果 AI 算法稳定下来(现在 Transformer 一统江湖),那 ASIC 的性能优势更明显。而目前关于 AI 算法快走到头的声音不绝于耳,除了世界模型,还有更前沿的比如非线性动力学计算等,让 AI 像人脑一样思考,而不是当前的计算机架构。当然,这些就只有走着瞧了。
2、国产 AI 芯片的"路线分化"
中国玩家在这两条路上都布了局。每家选哪条路,往往是由创始团队的背景决定的。
走 GPGPU 路线的几家,包括海光、摩尔线程、沐曦、壁仞、天数智芯、燧原,基本都是英伟达和 AMD 的"出走系":
海光信息:通过 AMD 的 x86 架构授权进入 CPU 市场,DCU(深度计算单元)也是基于 AMD 的 CDNA 路线。和"光合组织"绑定后端 x86 生态。它的最大优势是类 CUDA 兼容,客户从英伟达迁过来代码改动小。
摩尔线程:创始人张建中是英伟达的"封疆大吏",做过英伟达全球副总裁、中国区总经理整整 14 年,把英伟达中国区市占率从 50% 做到 80%。2020 年带着一批英伟达老部下出来创业,整个公司在复刻英伟达,做"全功能 GPU",既做数据中心也做消费级显卡。
沐曦股份:创始人陈维良做过 AMD 全球 GPU SoC 设计总负责人,两位 CTO 都是 AMD 企业院士。整个团队是"AMD 系",做的是类似 AMD 那种"通用 GPU"的东西。
壁仞科技:创始人张文是商汤的前总裁,硬件架构负责人来自华为海思,团队混合了英伟达、AMD、高通等公司背景。走的是"原创架构 + 暴力算力"路线。
走 ASIC/DSA 路线的几家,寒武纪、华为昇腾、阿里平头哥、百度昆仑芯,背景就完全不一样:
寒武纪:中科院计算所血统,做的是纯 AI 芯片,不碰图形渲染,它在这一派里是"独立第三方"——不依附于任何互联网大厂或硬件巨头。
华为昇腾:华为内部立项的"达芬奇架构"。最大特点是全栈自研,芯片、服务器、组网、操作系统、AI 框架(MindSpore)全部自己做,这是华为一贯的风格:要做就做整套。
阿里平头哥:阿里旗下,主要为阿里自己的云服务器做芯片,也对外卖。新一代真武 PPU 据接近阿里的人士透露 2025 年累计出货量已经数十万片,可能已经超过寒武纪。这件事在寒武纪互动平台被投资者直接问过,公司未予确认也未否认。
百度昆仑芯:百度旗下,给百度自己的搜索、云、自动驾驶用,也开始外售。2026 年 5 月已经在科创板启动 IPO 辅导。
在上述路线分化里,能看到几个趋势:
一是大厂自研是大势所趋。阿里、字节、百度、腾讯都在做自己的芯片。问题是这些大厂同时也是寒武纪的客户。这就像一个供应商,最大的几个客户都在筹建自己的工厂,你今天拿到的订单,明天可能就转给客户的内部团队了。这是寒武纪最大的潜在风险之一,长期来看,这个风险其实是随着时间推移越来越大而不是越来越小。类似于本人写过的高通研报,他的客户也是一家家从合作到出走,已经形成长期压力。
在评估 AI 产业链时,我最近有一个感受就是,既需要关注短中期的发展,还要从第一性原理的角度去思考,其护城河随着时间推移会越来越宽还是越来越窄。
第二,GPGPU 派几乎全是英伟达 / AMD 的出走系。做 GPGPU 的难度极大,没有十年以上的 GPU 经验团队几乎做不出来。这意味着这些公司本质上是在"复刻英伟达",是好是坏,这个其实很难单一维度评价。但大多数爆发式增长的科技企业,往往需要从 0 到 1 杀出来。这方面可参考本人写的曦智科技研报,感兴趣的可以长期关注。
第三,寒武纪选了一条最孤独的路。它既不是大厂自研,没有内部客户兜底;也不是 CUDA 兼容派,没有生态优势;更不是英伟达出走系,没有现成的 GPU 技术积累。它是在用自研的指令集和架构,硬刚一个全新的赛道。这件事的好处是壁垒高,学院派十年以上的专利积累;坏处是生态更薄弱。
把这条孤独之路再往里看一层,会看到自研指令集是寒武纪所有技术决策里最大的一笔赌。
指令集相当于芯片和软件之间的"语言",这里用"语言"是个简化比喻,严格来说指令集只是最底层一层,往上还有微架构、编译器、算子库、AI 框架等好几层。
英伟达的 CUDA 是一整套语言加生态,写完的程序换张英伟达芯片就能用,因为兼容;
海光走的 AMD ROCm 生态本质上是"类 CUDA 翻译",客户从英伟达搬过来代码改动不大;
华为昇腾自己搭了从达芬奇微架构到 CANN 异构计算平台再到 MindSpore AI 框架的全栈,但有华为整个生态背书。
寒武纪也走自研路线——自研 Cambricon ISA 指令集、MLUarch 微架构和上层软件栈,没有大厂生态背书,这意味着每接一个客户,都要把模型从 CUDA 翻译过来,再把训练框架(PyTorch/TensorFlow)的算子做一遍适配。
围绕 DeepSeek 等头部国产模型,市场上常出现"Day 0 支持""快速适配"这类提法,寒武纪也是其中被频繁提到的国产芯片公司之一。这些指的是模型层面的快速适配。但客户是否愿意把生产环境的训练任务整个搬过来,取决于算子覆盖度、稳定性、调试工具是否完整——这些是工程问题,需要时间沉淀,没法用"Day 0"的速度解决。
这个赌注的回报方式是:如果未来 AI 算法稳定下来,ASIC 的性能 / 能效优势能压倒 GPGPU 的灵活性,寒武纪二十年专利积累的护城河就立得住。但如果未来出现明显不同于 Transformer 的主流架构(前面提到的世界模型、状态空间模型 SSM、非线性动力学计算等),自研指令集本身未必要推倒重来,但编译器、算子库、内存调度、调试工具都要重新过一遍工程关——这条赌注同样会松动。
这条路,可能赢得透彻,也可能输得惨烈。
3、寒武纪的产品——思元系列
寒武纪的旗舰产品系列叫"思元"。它不是公司全部收入,但 2025 年公司云端产品线(包含思元芯片和板卡、智能整机)贡献了营收的 99.69%,绝对主力。
但要特别注意:下面写到的思元 590、思元 690 的具体参数(算力、显存容量、单价、对标对象、量产时间),公司从来没有在公告里逐项披露过。这些数字基本来自券商研报、产业链口径和媒体转述,寒武纪自己 2025 年也专门发过公告说"网上传播的关于公司产品、客户、供应、产能预测等信息存在误导市场的风险"。所以我下面写的是市场口径下的产品形象,不是公司确认事实,看的时候带着这个口径意识。
主要的几代产品:
思元 370(2021 年发布):7nm 制程、Chiplet 架构、推理为主。2024 年还有出货,但已经退居二线。
思元 590(2023 年首次披露/送样、2024 年规模出货):7nm + Chiplet,96GB HBM2e 显存,FP16 算力约 345 TFLOPS,性能据市场口径接近英伟达 A100 的 80-90%,单价 6-8 万元。当前公司收入的主力。
思元 690(2024 年送测、2026 年初规模量产):基于中芯国际 N+2 先进制程(业内对其工艺等效定位有争议,主流观点接近 7nm+,群智咨询将其归类为 5nm 节点)、双 Die Chiplet、HBM3,FP16 算力据市场口径超 700 TFLOPS、196GB HBM3、互连带宽超 890Gbps,单价约 13.5 万元。这一代的算力是 590 的两倍多,HBM 容量也是 590 的两倍。性能目标据市场口径对标英伟达 H100 的 80-85%。
如果把寒武纪和英伟达放到时间线上:
A100 是英伟达 2020 年的产品,思元 590 对标的是 5-6 年前的英伟达 H100 是 2022 年的产品,思元 690 对标的是 3-4 年前的英伟达 英伟达最新的 Blackwell(B200)2024 年发布,这个寒武纪还远远跟不上
寒武纪不是和英伟达打"平推战",而是在一个"代差"内做替代。这件事在正常市场环境里没什么生意可做,但目前全球的竞争格局反而给了寒武纪一个发展良机。
4、时机
2022 年 10 月,美国商务部正式发布对华芯片出口管制规定(此前 8 月已通知英伟达暂停 A100/H100 对华出口),随后管制层层加码:A100、H100 禁,特供版"H800"也被禁,再后来推出更次一级的"H20",2025 年 4 月又被收紧。
英伟达 CEO 黄仁勋自己说过:英伟达在中国大陆的市场份额,从拜登政府初期的 95% 下滑到了 2025 年的约 50%(按 IDC 出货量口径为 55%;同时年内黄仁勋也提到,在中国高端 AI 芯片细分市场,份额已经接近清零)。
被强行释放出来的,是英伟达从 95% 降到 50% 之间的那 45 个百分点——大约几百亿到上千亿人民币的算力市场。
到底每家国产 AI 芯片厂商出货多少?这件事在中国市场目前没有真正的权威统计。因为寒武纪、华为昇腾、昆仑芯都只在年报里披露销售金额、不披露出货量;工信部、半导体行业协会的统计不会细到单家公司;剩下的就只能靠 IDC、Gartner、群智咨询、Counterpoint 这些第三方研究机构估算,但它们都是私营商业公司,靠访谈厂商和渠道商推算出货量,各家口径不同、数字不同,有时候差异很大。
媒体最常引用的是 IDC,下面这张表 IDC 2025 年中国 AI 加速卡口径,是目前被多家媒体转述的公开度最高的版本。表格按出货量统计、不是按销售金额,总量约 400 万张。这张表,大家看的时候要注意,统计口径是否含有自用IDC没有说明,也未能在公开口径中查到,这一点对于比如昆仑芯(百度内部大量自用)、平头哥(阿里云自用)、华为昇腾(华为云自用)的真实算力规模影响可能会比较大。
国产化率据 IDC 口径 2025 年达到 41%(165 万张 / 400 万张),比 2024 年的约 30% 大幅提升。
表格中有一些异常值,比如昆仑芯和寒武纪都被列为 11.6 万张并列第三,但参考 IDC 自己 2024 年的数字,昆仑芯 6.9 万片、寒武纪 2.6 万片,昆仑芯是寒武纪的 2.7 倍;2025 年百度宣布昆仑芯三代万卡集群点亮、计划扩展到 3 万卡;2025-2026 年中国移动推理型 AI 服务器集采里,基于昆仑芯的服务器在三个标包分别拿下 70%、70%、100% 份额、均排名第一,寒武纪未跻身主要供应商之列。
这些产业事实我觉得和"两家并列 11.6 万张"明显不符。可能的解释,可以大概猜测IDC 的统计可能只算厂商对外销售、不含百度自用部分(这部分昆仑芯规模很大)——毕竟要统计自用部分本来就很难。准确数据关注的小伙伴可以等昆仑芯上市时的报告了,届时会是一个好的研究节点。
但仅从上表也能看到,国产阵营内部其实是"一超多强",华为昇腾一家拿了 49%,剩下所有玩家加起来才一半。寒武纪在国产阵营内排在华为之后、阿里之后,与昆仑芯一起属于第三梯队(甚至可能在昆仑芯之后),在中国整体市场里排在英伟达、华为、阿里、AMD 之后,不是前排玩家。
另外,寒武纪在 A 股市场的"地位",并不完全来自市占率,更来自稀缺性,它是 A 股最早、最成熟、且首家实现盈利的纯 AI 芯片设计标的。海光信息偏 CPU+DCU 双轮。"国产 GPU 四小龙"中,摩尔线程、沐曦股份在 2025 年底登陆科创板,壁仞科技、天数智芯在 2026 年初登陆港股,但这四家都还在亏损或盈利验证早期。
机构想配置一个"已盈利的纯 AI 芯片标的",目前唯一的选择仍然是寒武纪。但这种稀缺性是不稳定的。"国产 GPU 四小龙"到 2026 年初已经全部上市,摩尔线程、沐曦在科创板,壁仞、天数智芯在港股,燧原、昆仑芯也在 IPO 路上。半年的时间里,寒武纪从"唯一"变成了"五选一",稀缺性溢价正在被稀释。
5、"中立第三方"的位置有反例
寒武纪在国产 AI 芯片大厂阵营里,是没有"内部客户"兜底的独立第三方。
把玩家摆开看:
华为昇腾:华为内部用为主、对外卖兼有
阿里平头哥:阿里内部用为主、外售扩张中
百度昆仑芯:百度内部用为主、外售扩张中
字节 SeedChip:纯自用,2026 年量产
寒武纪:纯第三方,没有任何"内部业务"兜底
这件事可以一分为二去看待:不好的一面是,别人有自己的业务作为芯片的稳定订单来源,寒武纪只能在外面找客户;但好的一面是,中立第三方反而是少数能被多家大厂同时接受的供应商,因为互联网大厂之间是有竞争的。字节不太愿意买阿里的芯片,阿里也不愿意采购百度的方案——在我们上一篇关于台积电的深度文章中,我们讲到,台积电的中立是成就它霸主地位的关键因素。
不属于任何一家,所以可以同时服务所有家。
当面,从长远来看,又有不同。比如,英伟达是中立的,大家虽然都买英伟达,但最后互联网大厂有能力的都想自研,比如Google 搞TPU?因为自研的核心驱动力不是"摆脱依附",而是成本优化和场景定制。所以"中立性"是个短期窗口期资产,它能延缓采购转移的速度,但阻止不了大厂自研,寒武纪能不能在大厂自研芯片成熟之前把生态壁垒筑得足够厚,是它未来三五年最关键的赛跑。
6、客户是谁
寒武纪有一个让所有投资者头疼的特点:它从不公开披露大客户的名字。
公司财报里只有 2021 年和 2022 年披露过第一大客户——分别是江苏昆山和南京市的国资背景智能计算中心项目公司。其他年份都是"地方国资背景的算力基础设施投资主体"或者"运营商、金融、互联网领域头部企业"这种模糊表述。
但客户集中度的数字披露得很清楚:
寒武纪从来没有真正分散过客户——前五大客户占比 2024 年 94.6%,2025 年降到 88.7%,对一家以服务器和云客户为主的芯片设计公司来说仍然偏高。
2025 年发生了变化:第一大客户占比从 79% 降到 26% 出头,前五大才降 6 个百分点,意味着收入不是分散到几十个客户,而是从"一个超大客户"换成了"几个仍然很大的客户"。2025 年报披露前五大客户中,第三大是"长期合作伙伴",其他四家都是 2025 年新增。前五大销售额分别为 17.03 亿、14.01 亿、12.37 亿(推算)、7.64 亿、6.55 亿。
需要单独说明的是 2025 年中报里的 85.31%。这个数字不是销售收入口径,而是前五大客户的应收账款和合同资产期末余额占比——五家具体占比 42.5%、18.0%、8.9%、8.4%、7.6%。这不是营收集中度,是回款集中度,两者不能直接比。这个数字真正告诉我们的不是"上半年第一大客户占 42.5% 营收",而是"账期到中报时点,钱主要还压在这五家手里"。一家公司销售收入分散和应收款集中并存是常见的,但如果应收款一直集中在少数几家,回款风险就要单独看。
关于这几个大客户是谁,市场上有传言。彭博社 2025 年报道字节跳动是当前最大客户、订单占比超 50%;中国移动哈尔滨智算中心 2024 年 8 月投产,部署超 1.8 万张 AI 加速卡(据公开报道含相当数量寒武纪思元 590);阿里、腾讯也有合作但规模未知。这些都没有寒武纪自己的官方确认。另外,现在最大客户(市场推测是字节)正在自研芯片,团队据公开报道已超千人,2026 年计划量产——这会让人想起与华为的那一段蜜月的甜蜜和分手的决绝。
总之,公司不愿意告诉股东钱从哪来,这种信号就看各人如何解读了。
三、2025年为什么突然爆发
一家亏了八年的公司,2025 年一下子赚了
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场
首页
快讯