DeepSeek创始人梁文锋:拒绝阿里投资,自掏200亿启动首轮融资

笔逼5 小时前

2026年5月8日,中国AI公司DeepSeek正式启动成立以来的首轮外部融资,目标募资最高达500亿元人民币,投后估值有望突破3500亿元人民币,刷新中国AI公司单笔融资纪录。创始人梁文锋个人计划出资最高200亿元人民币,占总募资规模的40%。目前,他仍持有DeepSeek约84%的控制权。

这家成立于2023年7月的公司,在近三年时间里从未接受过任何外部股权投资,其背后依托的是母公司幻方量化的强力支撑。

幻方量化的三年支撑

梁文锋如何拿出200亿元人民币?这离不开DeepSeek的母公司幻方量化。2015年,梁文锋与浙大校友徐进共同创立量化私募基金幻方量化,他担任CEO并持有约85%的股权。

幻方量化进入AI领域并非偶然,量化投资本身高度依赖算力和机器学习模型。2016年,公司上线首个AI交易策略;到2017年,已实现所有量化策略的全面AI化。

ofZfrWgPtkEZ1kCN95iNrNQXiXJdCbR9Qco3ffiM.png

2019至2022年间,幻方量化启动并投入自建深度学习算力平台“萤火一号”和“萤火二号”。“萤火一号”总投资近2亿元人民币,于2020年正式投用,搭载1100张高端GPU加速卡;“萤火二号”则在2021年斥资约10亿元人民币建设,拥有约1万张NVIDIA A100 GPU,是当时国内除头部大厂外极少数拥有如此体量算力的非互联网公司。

这两套平台为DeepSeek早期模型训练奠定了基础。2023年5月,梁文锋公开宣布进军通用人工智能;同年7月,由幻方量化内部孵化成立杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。早期模型训练直接依托现成的“萤火集群”,首期研发投入30亿元人民币,全部来自幻方自有资金。

幻方量化的利润持续输入DeepSeek的研发,使其具备了孵化AI研究的内部条件。公司定位更像研究型实验室,不开源以外的商业化、不做ToC应用、不受VC商业时间表绑架,扁平管理、年轻程序员团队、研究员自由调用算力。

梁文锋多次拒绝腾讯、阿里等投资邀约,强调“DeepSeek的问题从来不是钱”“是非观优先于利害观”。他用AI量化积累的算力和模型能力,直接冲刺开源高效大模型(V系列),追求中国AI原创前沿。

首次融资背后的现实压力

2025年下半年到2026年初,DeepSeek遭遇成立以来最严重的人才动荡期,核心研究员接连出走:

  • V3/V2架构关键贡献者罗福莉加盟小米,出任MiMo推理大模型负责人;
  • R1推理引擎核心作者郭达雅跳槽字节跳动Seed团队;
  • 多模态模型核心贡献者阮翀出任自动驾驶公司元戎启行首席科学家;
  • 第一代大语言模型核心作者王炳宣加入腾讯混元团队;
  • OCR系列核心作者魏浩然等也相继离职。

这些离职覆盖了基座模型、推理、多模态、OCR等几乎所有核心技术线。

T5KVBKywNWXx7VgEJsO2vROc98CEDCKfPoOXVhJf.png

与此同时,V4模型的迭代节奏加快,训练所需的算力规模同步攀升。原计划2026年2月发布的V4模型因算力瓶颈和适配难度多次延期,直到4月24日才上线预览版并同步开源。

此外,国产芯片的适配难度远超早期预期,算力采购路径复杂,单靠幻方内部的算力储备难以支撑。这一系列现实压力推动梁文锋在2026年4月中旬首次打开融资大门。

融资谈判与商业化方向

4月,融资消息曝光时,外界对DeepSeek的估值约为200亿美元。随着V4预览版开源,算力需求和商业化信号同步释放,短短数周内估值翻倍,最新报道指向450亿至515亿美元区间。

阿里看重生态闭环整合,但DeepSeek不希望与任何一个平台形成强绑定,双方谈判告终。腾讯提出认购最高20%股份的方案,但未被接受。国家集成电路产业投资基金被视为最有可能领投的选项。

融资资金将主要用于扩充算力资源、提升薪酬留住顶尖人才,以及支持后续模型迭代和大规模部署。V4.1的方向逐渐明确,加强MCP协议适配、增加图像与音频理解能力,并为企业用户提供更多工具接口。

8linLjcHbOFYRrvKlvevPmXqE4Kd0a083k6k6ELS.png

在全球技术竞争加剧、算力成为国家战略资源的2026年,梁文锋用这种方式确保,节奏仍然掌握在自己手里。

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场