作者丨邱晓芬编辑丨苏建勋近期,英伟达卡租赁价格崩溃的话题,引起了AI行业的热议。外网一篇流传甚广的文章中,用“英伟达GPU租赁泡沫破裂”这一惊悚的表达,来形容当下这一趋势。..
18584883263 立即咨询发布时间:2025-09-11 热度:0
作者丨邱晓芬 编辑丨苏建勋 近期,英伟达卡租赁价格崩溃的话题,引起了AI行业的热议。外网一篇流传甚广的文章中,用“英伟达GPU租赁泡沫破裂”这一惊悚的表达,来形容当下这一趋势。 36氪了解到,英伟达核心产品在中国的租赁价格剧烈波动确实是事实,英伟达热门芯片在2024年的租赁价格走势如下—— 英伟达H100,一般以8卡为一个节点的形式出租。一张卡年初的市场报价在12-18万/月之间浮动,如今降到7.5万; 消费级显卡“英伟达4090”,此前“挖矿热”时一度被炒至一万八、九,一卡难求。今年年初,“英伟达4090”单片的租赁价格为一万三左右,目前的租赁价格大概是七八千。 也就是说,英伟达这两款热门芯片租赁价在10个月内双双降了50%,不再是前两年一卡难求的香饽饽。 不过,多位行业人士表示,不像外网文章那般耸人听闻,这并不需要恐慌。有行业人士测算,过去常规算力芯片租赁价格,在五年内大致有80%的下滑——英伟达H100、4090的发布时间是2022年,距今2年,大致符合价格下降的客观规律。 当然还有其他原因的综合作用。英伟达热门芯片租赁价格的下滑,本质上是英伟达产品周期、以及算力市场供需变化等因素的作用力。 而面对市场的新变化,国内的算力行业也在紧急做出各种调整。 英伟达芯片租赁价格下降,与英伟达当下处于新旧产品交接期有关。 一位行业人士表示,相比H100,英伟达今年的Blackwell架构新品GB200,单位算力成本更低,而大部分AI公司基于降本考虑,基本选择“蹲新品”,致使老产品一定程度上遇冷。 在黄仁勋的描述中,新品完全是另外一副光景——其称,Blackwell芯片需求旺盛,导致份额分配就像“走钢丝”,他一不小心就会“得罪大客户们”。 但纵使万众期待,这款新品却面临着尴尬延期问题。 英伟达的工程师们把困境归咎到台积电采用了一项全新的封装技术上;台积电方面则指责英伟达疯狂催促生产流程,给予他们比以往过短的验证时间。这导致,英伟达本应在今年第三季度就推向市场的新芯片,如今推迟到第四季度甚至明年。 一位芯片行业人士向36氪预测,在GB200正式面世后,英伟达老芯片租赁价格下跌态势很有可能进一步加剧,其判断,“预计近半年内不会恢复”。 此外,英伟达产品租赁价格的猛烈下降,还与目前算力市场供给与需求并不匹配有关。 在国内,算力行业的布局模式与国外相反——国内是先搭好算力的池子,再逐步发展AI应用,是“拿着钉子找锤子”;而国外的算力行业更加商业化一些,更倾向于找到了确切客户后,再建与之匹配的算力中心。 有行业统计数据显示,最近两年,国内总共涌现了大大小小1.3万个智算中心,截至2024年上半年,国内算力规模已达全球第2(246 EFLOPS),智能算力同比增速超过65%。 在这次建设潮中,国内也同步掀起了英伟达H100芯片的囤积潮。当这些芯片以中国香港、新加坡为中转站,好不容易凭借各种隐秘方式进入国内,算力行业却悲观发现,原本最消耗算力的预训练,诉求普遍下滑。(详情点击:《大模型「六小虎」里,至少两家要放弃大模型了 | 焦点分析》) 与此同时,2024年以来,尽管推理和模型微调的需求有所反超,大有超过预训练的态势,但也同样没有达到原先设想的“爆发”态势,“目前还没有看到AI的超级应用、或者明确的场景”。 当最近两年囤积大量芯片所产生的算力,短时间内并没有广泛的AI应用得以消纳,算力行业供给和需求的天平倾斜,价格的下滑也在意料之内。 在过去,算力行业一项目普遍的商业模式是卖英伟达“裸金属”,行业俗称“卖铁”。但在算力行业供需变化的当下,纯卖硬件的模式过于简单粗暴,很难持续。尤其是,当英伟达租赁价格今年以来出现“崩盘”,下游AI行业对于算力芯片的观念也悄然发生变化。 如果说,前两年谁能买断更多英伟达芯片,就意味着谁就最有机会更快训出更强大的模型。而现在的AI公司们,更倾向于选择租赁芯片的方式获得算力,而非直接买断芯片重资产、挤占现金流。 为此,上游的算力行业也做出了相应调整来适应这种趋势,尝试推出更多元的租赁服务。 一位行业人士表示,过去AI厂商若租用英伟达卡,基本需要多个节点、按年起租。但今年的变化是,有算力需求的客户不仅变得分散,同时,他们对成本也变得格外敏感,分时租赁的要求变得很高。 “现在一些算力中心也允许你一次只租几张英伟达的卡、只租用几个小时”。这有点像,过去你需要按年整租一两层楼,但现在允许你短租一间房了。 不过,这种变化的直接后果是,算力行业的回本周期变得更长。有行业人士向36氪粗略测算,“一个用H100芯片搭建的算力中心,硬件回本周期高达5年以上”。 与此同时,算力行业从业者们,正在尝试增加算力服务的颗粒度,有逐渐向上层的模型层、应用层延伸的趋势。 36氪了解到,一些智算中心运营方在卖算力之余,也会顺带帮助下游的AI客户做好模型的微调; 或者直接深入几个对算力需求更强的行业,比如金融、医药、新能源,与具体的场景做结合,挖掘更多可以卖算力/租算力的潜在需求。 前述行业人士表示,他们经过测算,搭配着种种AI服务,“硬件的成本回本周期,最短能缩减到2年左右”。 这些调整都不是坏事。当AI行业和算力行业共同经过两年的高速狂奔,如今供需关系变得更清晰,而这两方正用更理性的眼光,看待过去两年他们视若珍宝的英伟达芯片。 end end算力供需天平倾斜
从前买卡,现在租卡
关键词:
英伟达这几年很火。因为AI的带动,它几乎成为全球最受关注的公司。 我们总是会在网上看到和英伟达有关的一些名词,例如: A100、B100、H100、GH200、GB200、NVLINK、NVSwitch、DGX、H···...
本文来自微信公众号:王智远,作者:王智远,原文标题:《H20解禁,中美AI闭环竞赛开启》,题图来自:AI生成 黄仁勋又来了。 今年第三次来中国,北京35度的大热天,他居然还穿着那件标志性的“黄夹克”,站在小米汽车前···...
不得不说,英伟达专门为中国市场定制的H20芯片,最近算是彻底卖不动了。原因其实挺直接——性能拉胯还可能有安全隐患,中国用户自然不买账。 先说性能问题。H20是基于英伟达高端芯片H100“阉割”而来的,但阉割得实在太狠,性能···...
2025 年 7 月 17 日,英伟达首席执行官黄仁勋离开北京中国国际供应链博览会 (CISCE) 时向人群挥手致意。 看点英伟达的最新盈利数据显示其芯片销售持续强劲,但有一个缺项却格外引人注目···...
你提到的关于英伟达H20芯片的情况,确实涉及到一些复杂的技术和安全问题。下面我将根据目前的信息,为你梳理一下事件的来龙去脉和可能的影响。 网信办约谈英伟达的原因 国家互联网信息办公室(网信办)在2025年···...
导语 当地时间8月21日下午,科技媒体《The Information》援引知情人士消息披露,英伟达(NVIDIA)已通知韩国三星电子、美国安靠科技等核心供应链企业,暂停H20芯片的相关生产工作。这款曾支撑起英伟达中国市场···...
近日,英伟达销售给我国的算力芯片H20,因被曝出存在严重安全问题,被我国网信办约谈。 人民日报锐评道:英伟达,让我怎么相信你? 简单捋下事件脉络。 2023年底,英伟达推出H20芯片,陆续向中国客户供货。今···...
日前,英伟达CEO黄仁勋在北京访问期间宣布,美国政府已批准H20芯片恢复对华出口。 H20芯片,是英伟达按照美国对华技术出口管制要求专为中国市场设计的AI芯片,性能远不及其国际市场主流GPU芯片H100。今年4月,该芯片被···...
(来源:即梦AI ) 朋友们,今天接着聊AI芯片的话题。 据“观察者网”报道,8月22日,外媒援引知情人士的消息称,英伟达已经告知安靠科技、三星等供应商,暂停H20相关生产。而在此前的7···...
快科技8月30日消息,英伟达刚刚发布的财报显示,本财季中国厂商没有采购一块H20芯片,黄仁勋都看在眼里,他也非常着急。 H20被质疑可能存有后门风险后,虽然黄仁勋和英伟达多次回应,但也仅仅停留在语言层面,而没有拿出什么有利···...
今年3月份,英伟达发布了Blackwell B200,号称全球最强的 AI 芯片。它与之前的A100、A800、H100、H800有怎样的不同? 英伟达GPU架构演进史 我们先回顾一下,历代英伟达AI加速···...
小明 发自 凹非寺 量子位 | 公众号 QbitAI 双十一大促没有羊毛可薅? 不如来看看算力吧(doge)。 A800价格低至5.88元/卡时,H800价格低至9.99元/卡时。限量开抢,先到先得···...
作者|程茜编辑|心缘 智东西2月24日报道,刚刚,DeepSeek开源周第一天重磅更新来了,开源首个代码库——FlashMLA,发布一小时GitHub Star数冲上1700。 FlashMLA指的是De···...
大周末的,DeepSeek悄么声放了个大招。 他们知乎官号发了一篇雄文,披露了【如何对DeepSeek V3/R1的推理系统进行优化】,文章有2大核心内容↓ 一、如何通过优化架构,让模型推理获得更大的吞吐和更低的延···...
这个暑假,在学校搞 AI 的你是不是还在卷研究? 是不是还缺点算力? 是不是想要点折扣? 它来了!面向高校用户,英博云特别推出「暑期现金消耗返券活动」。 满足规则,A800 低至 4.26 元 / ···...
客服微信号
安徽合肥高新区