发布时间:2025-09-12 热度:0
大周末的,DeepSeek悄么声放了个大招。 他们知乎官号发了一篇雄文,披露了【如何对DeepSeek V3/R1的推理系统进行优化】,文章有2大核心内容↓ 一、如何通过优化架构,让模型推理获得更大的吞吐和更低的延迟 简单概括就是三板斧↓ ① 大规模跨节点专家并行 ② 计算-通信重叠优化 ③ 多级负载均衡策略 前两步可以提升吞吐、降低延迟,而第三步用于优化GPU的占用率。 DeepSeek在线推理系统架构图 二、测算一下:在这种优化架构下,按照目前DeepSeek官方的收费策略,一天能赚多少钱 DeepSeek在文中给出了这样一个典型“优化推理”系统的投入产出比,也就是说,成本多少钱,能赚多少钱。 这些数据是基于正在运营的线上系统实测得来的,可参考性极高。 看第一张图,最近24小时内(2月27日12点-2月28日12点),DeepSeek V3 和 R1 推理服务占用GPU节点总和↓ 峰值占用为278个节点,平均占用 226.75个节点(每节点为 8个H800GPU)。 如果按每GPU租金2美金/小时来计算,总成本为2×226.75×8×24=$87,072/天。 而在对应的时间内,产生的Tokens数量和收入是多少呢? 总输入:608B(其中56.3%命中硬盘中的KV Cache);总输出:168B 平均每台H800服务器的吞吐量为:73.7k tokens/s (输入)、14.8k tokens/s(输出)。 不得不说,DeepSeek优化完的推理系统性能真是高啊! 各家一体机厂商可以自己比一比,只有几K甚至几百tokens的单机还好意思拿出来么? 接下就是收入估算,在这24小时里,理论总收入是$562027(折合人民币约409万),成本利润率高达545%! (当然DeepSeek官方也说了,实际收入没有这么多,因为web版目前免费、API夜间还打折,还有V3比R1便宜) 但是,这个收益已经足够震撼! 只能说,DeepSeek真太牛了。 有圈内人士说,DeepSeek这个发布,为实际项目带来了极大的参考价值! 就是别瞎来! 因为,接下来对算力黄牛来说,挑战来了—— 这个数字几乎是算力生意ROI的天花板,大家再画饼的时候,不要要超过这个数哦,否则这饼就不圆了。
关键词:

英伟达这几年很火。因为AI的带动,它几乎成为全球最受关注的公司。 我们总是会在网上看到和英伟达有关的一些名词,例如: A100、B100、H100、GH200、GB200、NVLINK、NVSwitch、DGX、H···...

本文来自微信公众号:王智远,作者:王智远,原文标题:《H20解禁,中美AI闭环竞赛开启》,题图来自:AI生成 黄仁勋又来了。 今年第三次来中国,北京35度的大热天,他居然还穿着那件标志性的“黄夹克”,站在小米汽车前···...

不得不说,英伟达专门为中国市场定制的H20芯片,最近算是彻底卖不动了。原因其实挺直接——性能拉胯还可能有安全隐患,中国用户自然不买账。 先说性能问题。H20是基于英伟达高端芯片H100“阉割”而来的,但阉割得实在太狠,性能···...

2025 年 7 月 17 日,英伟达首席执行官黄仁勋离开北京中国国际供应链博览会 (CISCE) 时向人群挥手致意。 看点英伟达的最新盈利数据显示其芯片销售持续强劲,但有一个缺项却格外引人注目···...

你提到的关于英伟达H20芯片的情况,确实涉及到一些复杂的技术和安全问题。下面我将根据目前的信息,为你梳理一下事件的来龙去脉和可能的影响。 网信办约谈英伟达的原因 国家互联网信息办公室(网信办)在2025年···...

导语 当地时间8月21日下午,科技媒体《The Information》援引知情人士消息披露,英伟达(NVIDIA)已通知韩国三星电子、美国安靠科技等核心供应链企业,暂停H20芯片的相关生产工作。这款曾支撑起英伟达中国市场···...

近日,英伟达销售给我国的算力芯片H20,因被曝出存在严重安全问题,被我国网信办约谈。 人民日报锐评道:英伟达,让我怎么相信你? 简单捋下事件脉络。 2023年底,英伟达推出H20芯片,陆续向中国客户供货。今···...

日前,英伟达CEO黄仁勋在北京访问期间宣布,美国政府已批准H20芯片恢复对华出口。 H20芯片,是英伟达按照美国对华技术出口管制要求专为中国市场设计的AI芯片,性能远不及其国际市场主流GPU芯片H100。今年4月,该芯片被···...

(来源:即梦AI ) 朋友们,今天接着聊AI芯片的话题。 据“观察者网”报道,8月22日,外媒援引知情人士的消息称,英伟达已经告知安靠科技、三星等供应商,暂停H20相关生产。而在此前的7···...

快科技8月30日消息,英伟达刚刚发布的财报显示,本财季中国厂商没有采购一块H20芯片,黄仁勋都看在眼里,他也非常着急。 H20被质疑可能存有后门风险后,虽然黄仁勋和英伟达多次回应,但也仅仅停留在语言层面,而没有拿出什么有利···...

今年3月份,英伟达发布了Blackwell B200,号称全球最强的 AI 芯片。它与之前的A100、A800、H100、H800有怎样的不同? 英伟达GPU架构演进史 我们先回顾一下,历代英伟达AI加速···...

小明 发自 凹非寺 量子位 | 公众号 QbitAI 双十一大促没有羊毛可薅? 不如来看看算力吧(doge)。 A800价格低至5.88元/卡时,H800价格低至9.99元/卡时。限量开抢,先到先得···...

作者|程茜编辑|心缘 智东西2月24日报道,刚刚,DeepSeek开源周第一天重磅更新来了,开源首个代码库——FlashMLA,发布一小时GitHub Star数冲上1700。 FlashMLA指的是De···...

大周末的,DeepSeek悄么声放了个大招。 他们知乎官号发了一篇雄文,披露了【如何对DeepSeek V3/R1的推理系统进行优化】,文章有2大核心内容↓ 一、如何通过优化架构,让模型推理获得更大的吞吐和更低的延···...

这个暑假,在学校搞 AI 的你是不是还在卷研究? 是不是还缺点算力? 是不是想要点折扣? 它来了!面向高校用户,英博云特别推出「暑期现金消耗返券活动」。 满足规则,A800 低至 4.26 元 / ···...
客服微信号
安徽合肥高新区