DeepSeek寻求首轮融资:V4模型将彻底摆脱英伟达依赖

谷燕西5 小时前

今早,AI圈因一则重磅消息沸腾了!从不融资的DeepSeek首次启动外部融资,目标估值不低于100亿美元,计划筹集至少3亿美元。这一消息由外媒The Information率先曝出。

DeepSeek V4模型相关图片

作为幻方量化旗下的明星项目,DeepSeek此前一直坚持不接受外部投资,保持独立性以专注于技术研发。然而,在当前AI大模型开发竞赛中,资金需求愈发庞大,DeepSeek也不得不改变策略。据内部人士透露,此次融资将用于扩充算力资源、提升团队薪酬竞争力,并防止顶尖研究人才流失。

与此同时,DeepSeek即将推出的V4模型备受瞩目。这款模型不仅参数量跃升至万亿级别,还采用了MoE(Mixture of Experts)架构,推理成本与V3持平。此外,V4还将支持100万token的上下文窗口,并引入名为Engram的条件记忆架构,实现超长上下文的恒定时间检索。

V4的另一大亮点是其多模态能力。据FT报道,V4将是DeepSeek首个原生支持文本、图像和视频生成的模型。代码生成能力也得到了显著强化,内部测试显示其在SWE-bench上的成绩超过80%,HumanEval达到90%。

值得注意的是,V4的核心突破在于底层硬件的迁移。DeepSeek选择放弃英伟达芯片,转而基于华为昇腾芯片进行训练。这一技术决策不仅是对国产芯片生态的支持,更被视为对美国芯片霸主地位的一次挑战。

英伟达CEO黄仁勋对此表示担忧,称“如果AI模型在中国硬件上表现最佳,这将是一个糟糕的结果”。显然,DeepSeek的这一战略转变让老黄倍感压力。

目前,V4的发布时间已多次推迟,最新消息指向4月底。多个信源证实,V4 Lite版本曾短暂出现在DeepSeek平台上,推理速度提升了30%,上下文召回率显著提高。

DeepSeek近日还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位,表明V4已进入大规模部署的最后准备阶段。

3亿美元的融资目标,押注的是前沿AI能否完全脱离英伟达生态独立运转。对于DeepSeek而言,这是一场硬仗,也是一次历史性的尝试。

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场