当前位置:首页 > 教程资讯 > 正文内容

拼多多出评助手资讯:刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达

来源:新智元

今早,AI圈都被这个消息震撼了。

外媒The Information曝出,DeepSeek正寻求首次外部融资!

打破「从不融资」铁律的DeepSeek,这次寻求以不低于100亿美元的估值,筹集至少3亿美元的资金。

在极其烧钱的AI大模型开发竞赛中,DeepSeek也需要充实资金弹药库了。



曾经的DeepSeek,坚决不融资

对冲基金巨头幻方量化旗下的DeepSeek,在R1引起硅谷和华尔街轩然大波后,多次拒绝了国内顶级风投和科技巨头的投资意向。

DeepSeek这次选择启动融资,意味着梁文锋终于做出了巨大的转变。

此前,作为技术理想主义者的他,一直希望保持DeepSeek的独立性,不受商业压力的干扰。

上一次发布新一代模型,还是在2025年DeepSeek R1爆火时。如今,DeepSeek已经让全行业等了一年半。

如果此次融资成功,DeepSeek就可以拥有更多算力,同时还能开出更高薪酬,防止顶尖研究者流失。

不过,由于DeepSeek「中国初创公司」的身份,一些美国风险投资人态度会比较谨慎。

DeepSeek V4的发布时间一再推迟,同时AI圈的竞争环境已经大变样。

如今全球的各大顶尖模型都在快速迭代,中美两国的科技巨头们正凭借财大气粗的优势不断占领高位。

或许,这种压力终于促使DeepSeek转变了融资策略。


V4,一场万亿参数的硬仗

按照The Information的说法,V4原定今年2月亮相,但已跳票多次。

路透在4月初给出的最新时间窗口是「未来几周内」。

从目前已知信息来看,V4的规模和野心远超前代。

参数量跃升至万亿级别。

V4采用MoE架构,总参数约1万亿,但每个token仅激活约370亿参数,推理成本与V3持平。这个设计思路延续了DeepSeek一贯的效率优先哲学。


来源网络的爆料图

上下文窗口扩展到100万token。

V4引入了一套名为Engram的条件记忆架构,实现了对超长上下文的恒定时间检索。据内部测试,在100万token长度下的信息召回率达到97%,远超V3在128K上下文时的表现。


原生多模态。

据FT报道,V4将是DeepSeek首个原生多模态模型,支持文本、图像和视频生成。此前DeepSeek的模型一直以纯文本为主,而其他旗舰模型早已拥抱多模态。

代码能力大幅强化。

V4从立项之初就以代码生成为核心目标。内部benchmark显示SWE-bench成绩超过80%,HumanEval达到90%。据称V4能处理整个代码仓库级别的复杂bug修复,在长上下文代码推理上的表现将超越Claude和GPT系列。

此外,还有爆料称,V4预计将分两个版本发布。

完整版超万亿参数,针对高级推理和复杂代码任务优化,面向华为昇腾芯片;轻量版约2000亿参数,面向通用对话和API服务,可在其他国产芯片上运行。

开源方面,V4计划以Apache 2.0协议开放权重,延续DeepSeek一贯的开源策略。

什么时候能用上?多个信源指向4月底。

3月9日,一个名为「V4 Lite」的版本曾短暂出现在DeepSeek平台上随后被撤下。

4月初,又有开发者发现API节点上出现了V4 Lite的测试版本,推理速度提升30%,128K上下文的信息召回率从45%跳到了94%。

DeepSeek近日还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位,这是该公司首次公开招聘算力基础设施相关的驻场人员。

种种迹象表明,V4已经不在实验室里了,而是在为大规模部署做最后准备。


老黄最不想看到的事正在发生

V4延期的核心原因,跟模型本身关系不大。真正的难点,是一场底层硬件的大迁移。

DeepSeek之前所有模型都基于英伟达芯片训练。但V4走了一条不同的路。

据路透报道,V4将运行在华为最新的昇腾芯片上。

DeepSeek的工程师们花了大量时间解决V4对华为芯片的适配问题,重写核心代码,从英伟达的CUDA生态迁移到华为的CANN架构。

这是一个技术决策,也是一个战略信号。

DeepSeek刻意没有给英伟达和AMD提前提供V4做优化适配,而是将早期访问权限独家给了国产芯片厂商。

如果V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型。

老黄本人对此也不淡定。

他在近期采访中直言,DeepSeek基于华为平台的新模型「对美国来说将是一个糟糕的结果」。

言下之意是,一旦AI模型被优化为在中国硬件上跑得最好,美国芯片的护城河就不再牢固。



3亿美元,脱离英伟达生态?

如今,即便是以「花小钱办大事」著称的DeepSeek,也无法仅靠一家持续输血。

据斯坦福大学2026年度AI指数报告,截至今年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。差距越小,每一步追赶的边际成本越高。

就在本月,OpenAI刚以3000亿美元估值完成400亿美元融资,相比之下,3亿美元也算不得天文数字。

V4真正的赌注,在于它要证明前沿AI可以完全脱离英伟达生态独立运转。

3亿美元,押的就是这一把。

⭐星标华尔街见闻,好内容不错过⭐

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”

扫描二维码,添加客服联系方式codeImg.jpg,获取专业服务支持。

版权声明:本文内容来源于网络公开信息,由多拼助手整理发布。如涉及版权问题,请及时联系我们进行删除处理。本站不承担任何法律责任。

本文链接:https://www.duopingzhushou.cn/post/3462.html

分享给朋友:

“拼多多出评助手资讯:刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达” 的相关文章

拼多多出评助手资讯:老牌3D打印机龙头赴港IPO,销量及利润率下滑难题待解

拼多多出评助手资讯:老牌3D打印机龙头赴港IPO,销量及利润率下滑难题待解

文 | 董武英2022年8月,扎克伯格在自己的社交媒体账号上分享了一组照片。照片中,这位超级富豪正在与一位3D打印工程师交谈,两边的桌子上则摆放着两台国产的3D打印机。近日,这个把产品摆到扎克伯格屋子里的3D打印机公司要上市了。这家公司就是创想三维,近期其向港交所递交了招股书。这家成立于2014年的...

拼多多出评助手资讯:中信保诚资管总经理空缺超一年终落定,临时负责人陈征宇转正

拼多多出评助手资讯:中信保诚资管总经理空缺超一年终落定,临时负责人陈征宇转正

专为保险业 打造的垂直新媒体平台中信保诚资产管理有限责任公司(以下简称“中信保诚资管”)公告称,经董事会批准,并报金融监督管理总局北京监管局核准,陈征宇任中信保诚资管总经理,自2025年8月19日起生效。作者|蓝鲸新闻 石雨 实习杨硕(图片来源:中信保诚资管公告)这家保险资管公司总经理的位置,空置已...

拼多多出评助手资讯:境外落网遣返后,288亿钾肥企业董事长正式被逮捕

拼多多出评助手资讯:境外落网遣返后,288亿钾肥企业董事长正式被逮捕

钾肥巨头亚钾国际(000893.SZ)8月19日晚间发布公告称,银川市人民检察院 依法以涉嫌挪用公款罪、滥用职权罪对董事长郭柏春作出逮捕决定。截至8月20日收盘,亚钾国际股价上涨1.37%,报31.18元/股,市值为288.1亿元。公告称,上述事项系针对郭柏春个人,与公司无关联。目前公司生产经营一切...

拼多多出评助手资讯:泰禾集团:董事长黄其森因涉嫌违法被辽宁省新民市监察委员会实施留置措施

拼多多出评助手资讯:泰禾集团:董事长黄其森因涉嫌违法被辽宁省新民市监察委员会实施留置措施

网易财经8月22日讯 泰禾集团公告称,泰禾集团股份有限公司董事会于近日获悉,公司董事长兼总经理黄其森因涉嫌违法被辽宁省新民市监察委员会实施留置措施。截止本公告披露日,公司存在资产被冻结、查封的情况,会对公司运营产生一定影响。除此之外,公司按原组织架构和管理体系在正常运转,各项经营活动仍然正常进行。公...

拼多多出评助手资讯:片仔癀十年首度出现中报净利下滑

拼多多出评助手资讯:片仔癀十年首度出现中报净利下滑

中药巨头片仔癀(600436)将出现近11年来中报净利首降。8月23日,片仔癀发布2025年半年度业绩快报显示,公司上半年营业收入53.79亿元,同比下降4.81%;归属净利润14.42亿元,同比下降16.22%。从半年度业绩来看,片仔癀上一次出现净利下滑的情况出现在2014年,2015—2024年...

拼多多出评助手资讯:AI 算力投入持续加码 光模块高景气度可期

随着全球 AI 产业迅猛发展,北美云厂商在加大算力投入上达成共识,资本开支持续扩张,大模型训练、 AI 推理等应用对算力的需求高速增长。随着AI产业趋势被市场认可,此前困扰市场的AI资本开支是否具有持续性的问题或得到系统性改善,A股算力投资有望摆脱没有长期逻辑的现状,并体现为个股估值中枢的提升和过度...