如果有人问AI时代最大的赢家是谁,答案几乎毋庸置疑——英伟达。凭借着一块块供不应求的H100,它就像淘金热里卖铲子的人,看着全世界的AI公司打得头破血流,自己却闷声发大财,市值一路冲破天际。最新财务文件显示,英伟达将在未来5年累计投入260亿美元巨资,全力推进开源AI大模型的研发。这意味着英伟达不再满足于卖铲子,而是要亲自下场挖金子了。
大手笔投资
3月12日,根据英伟达公司向美国证券交易委员会(SEC)提交的财务文件,英伟达将在未来5年累计投入260亿美元(约合1788亿元人民币)巨资,全力推进开源AI大模型的研发。英伟达公司也正式开启了从“芯片制造商”向“全栈式AI顶尖实验室”的战略转型。
根据规划,英伟达此次260亿美元的投入并非单纯聚焦于单一模型研发,而是覆盖开源AI大模型全产业链,资金将在未来18至24个月内逐步落地,首批自研开源AI模型最快将于2026年底至2027年初正式问世。
作为对比,这一投资规模远超OpenAI训练GPT-4时所耗费的30亿美元。而在技术路线上,英伟达选择了一条“开放权重”(Openweight)的“中间道路”。这一模式介于OpenAI的完全闭源与Meta旗下Llama系列的完全开源之间。
具体而言,英伟达将公开模型的关键参数(权重),允许企业和开发者免费下载,并在自己的设备或私有云上运行、微调,从而满足企业对数据隐私、定制化和成本控制的需求。但模型的训练数据和代码可能不会完全公开。
专注推动AI开放性的非营利机构Laude Institute创始人、计算机科学家Andy Konwinski则将英伟达的这笔投资定性为里程碑式信号。“他们处于众多开放与封闭AI项目的前沿交汇点,”Konwinski表示,“这是他们对开放性信念的一次史无前例的表态。”
此外,行业分析指出,开源策略对英伟达还具有更长远的商业意义。英伟达的模型发布时会公开权重及技术细节,方便初创公司和研究人员在其技术基础上进行修改和创新,这有助于形成围绕英伟达硬件生态的开发者网络,进一步强化其芯片的市场黏性。
比肩OpenAI
英伟达自2023年11月发布首个Nemotron模型以来,已陆续推出面向机器人、气候建模及蛋白质折叠等垂直领域的专用模型。英伟达应用深度学习研究副总裁Bryan Catanzaro还透露,英伟达近期已完成一个5500亿参数模型的预训练工作。在核心模型研发上,英伟达将重点研发多模态、多领域前沿大模型,覆盖语言、代码、科学计算、智能体等多个方向。
近日,英伟达还推出专为企业级多智能体系统设计的新一代开源大语言模型Nemotron 3 Super,模型总参数量达1280亿(推理仅激活120亿),原生支持100万token超长上下文窗口。与主流API访问模式不同,英伟达此次开放了模型权重、预训练/后训练数据集及完整训练方案。
1280亿参数,规模与OpenAI GPTOSS的最大版本大体相当。英伟达声称,在人工智能指数综合评分中,Nemotron 3 Super获得37分,而GPT-OSS仅为33分。
值得一提的是,英伟达同时承认,部分中国模型的得分高于这一水平。此外,英伟达表示Nemotron 3 Super参与了名为Pinch-Bench的新型基准测试,该测试专门评估模型对OpenClaw的控制能力,Nemotron 3 Super在该测试中位列第一。
在技术层面,英伟达公开了训练该模型所采用的多项创新方法,涵盖提升模型推理能力、长上下文处理能力及强化学习响应能力的架构与训练技巧。
Catanzaro表示:“英伟达正在对开源模型开发给予远比以往更高度的重视,我们正在取得大量进展。”
在生态层面,英伟达已与谷歌云Vertex AI、甲骨文云基础设施、戴尔技术、HPE等主流云服务商及硬件厂商达成合作,亚马逊AWS Bedrock及微软Azure的接入亦在筹备中。CodeRabbit、Factory、Greptile等软件开发智能体公司,以及生命科学机构Edison Scientific和Lila Sciences,也已宣布将该模型整合至其智能体工作流。
重新定义路线
长期以来,英伟达的核心优势集中在芯片硬件领域,全球AI芯片市占率超过80%,但在AI模型层的话语权相对较弱,此前大模型的技术标准、训练范式大多由OpenAI、Meta等厂商定义。
此次英伟达下场自研顶级开源模型,核心目的就是要从底层定义AI模型的技术路线,让自家的硬件架构、软件栈成为整个AI行业的事实标准,通过开源模型拉动算力需求。若Nemotron成为企业智能体AI的主流基础模型,大规模运行该模型所需的GPU基础设施仍将倚重英伟达——在模型层推进开放的同时,巩固硬件层的需求锁定。
金融分析师预测,如果英伟达在巩固其硬件霸主地位的同时,能在基础模型市场成功攫取10%的份额,此举有望在三年内为公司每年额外贡献高达500亿美元的营收。Bryan Catanzaro表示,推动开源生态发展完全符合英伟达的核心利益,此次巨额投资并非盲目跟风,而是经过长期行业研判后的战略抉择。
当地时间周二,英伟达CEO黄仁勋还发表了一篇罕见的关于人工智能的长篇博客文章,这是他自2016年以来发表的第七篇公开长文,文章系统阐释了AI产业的底层逻辑,黄仁勋在文中定义了AI的“五层架构”。他表示,当前AI产业仍处于极早期发展阶段,尽管行业已投入数千亿美元,但AI的真正潜力尚未被完全发掘,未来仍需数万亿美元的持续投资来完善底层基础设施。
黄仁勋指出,AI已成为当今塑造世界的最强大力量之一,它并非单一的聪明应用程序或模型,而是如同电力和互联网一样至关重要的基础设施,运行在真实的硬件、能源和经济基础之上,能够吸收原材料并转化为规模化的智能,未来每家公司都将使用AI,每个国家都将建设AI基础设施。
针对AI发展带来的就业担忧,黄仁勋认为,AI非但不会削减岗位,反而会创造大量新的就业机会,尤其是在基础设施和熟练技术工种领域,支持AI基础设施建设所需的劳动力极其庞大,AI工厂需要电工、水管工、钢铁工人、网络技术人员、安装工和操作员等,这些都是高技能、高薪酬的岗位,且目前供不应求。AI正在填补全球范围内卡车司机、护士、会计等岗位的巨大劳动力缺口,而非制造失业。
凭借着一块块供不应求的H100,它就像淘金热里卖铲子的人,看着全世界的AI公司打得头破血流,自己却闷声发大财,市值一路冲破天际。最新财务文件显示,英伟达将在未来5年累计投入260亿美元巨...[详细]
在数次临时停牌后,华泰柏瑞中韩半导体ETF溢价率依然居高不下。3月12日,华泰柏瑞中韩半导体ETF下跌1.02%,溢价率依然超过24%,换手率超过50%。近期,半导体板块关注度较高,投向A股半导体领...[详细]
3月7日,沪士电子股份有限公司(以下简称“沪电股份”)发布公告称,公司全资子公司昆山沪利微电有限公司(以下简称“沪利微电”)拟投资新建印制电路板(PCB)生产项目及配套设施,生产高层...[详细]