硬科技时代,我们到底需要怎么样的咨询?
本文来自微信公众号:TOP创新区研究院,作者:TOP创新区研究院、FTA Group,原文标题:《当麦肯锡遭到质疑:硬科技时代,我们到底需要怎么样的咨询?》,题图来自:AI生成
前不久,麦肯锡McKinsey发布了的一份关于“Neoclouds(新兴AI云服务商)”的报告,喏,就是下面这一篇。
但随后,在X(原Twitter)和硅谷硬核的Discord群组里,工程师、创始人以及像Dylan Patel这样的垂直领域分析师,对麦肯锡这份报告发出了前所未有的质疑。
知名半导体分析机构SemiAnalysis甚至还对报告进行了近乎残酷的拆解,注意看highlight的部分,咱们就不翻译了。
批评声音非常尖锐:
“一群从未焊过电路板、从未在机房通过宵的MBA,凭什么用精美的PPT来指导这场人类历史上最复杂的算力基建革命?”
这场争论的背后,其实是一个深刻的行业变局:
在极度垂直、极度复杂、极度快速的硬科技时代,传统的“通用型智库”正在遭遇前所未有的信任危机。
我们也开始思考:
在AI深水区,我们究竟需要什么样的行业洞察?
一、你没有build过,你就没有资格
回到上面我们说到的那份关于CoreWeave、Lambda Labs等“Neoclouds”的行业报告。
麦肯锡的结论是:
这些新兴云厂商只是“昙花一现的套利者”,终将被Hyperscalers(超大规模云厂商)吞噬。
每家机构的看法观点都不一样,这无可厚非,但问题是,其推导过程中的数据硬伤,却让一线从业者大跌眼镜。
比如,有一个细节就极具杀伤力:
麦肯锡在报告中为了论证Neoclouds资本支出过高、商业模式不可持续,隐含的假设是,每台AI服务器的成本约为69.3万美元。
然而,一线的从业者(Builders)立刻指出,基于2025年Q4的市场行情,即便是配置了8张B200/GB200的高端服务器,其真实的硬件BOM(物料清单)成本加上网络互联,大约在30万~40万美元之间。
看到了么?
这是一个高达100%的误差。
那为什么会发生这种错误?
因为咨询顾问习惯于看“公开列表价”(List Price),或者是包含了几年的服务溢价后的“打包价”,他们试图通过财务报表倒推物理成本。
而真正的行家看的是什么?
看GPU与服务器硬件:22万~28万美元。
看InfiniBand/Ethernet网络设施:4万~7万美元。
也要看电力与机柜建设(CapEx):这一部分虽然昂贵,但分摊到单台服务器的建设成本并非天文数字。
在硬科技领域,魔鬼不在细节里,魔鬼就是细节本身。
如果你的输入端数据(Input)有100%的偏差,那么你复杂的财务模型输出(Output)——关于EBITDA、关于ROI的结论——就毫无价值。
这种粒度的缺失,也导致了对商业模式的误判。
麦肯锡将Neoclouds定义为“裸金属租赁商”(Bare-metal landlords),认为它们只是在利用英伟达显卡的短缺赚取差价,技术含量极低,利润微薄(估算约8%的息税前利润)。
但垂直领域的专家看到的是完全不同的图景:
SemiAnalysis的最新数据显示,CoreWeave等头部玩家的毛利率在签署长期保留合约(Reserved Contracts)时可达45%~55%。
更重要的是,这些厂商早就不是简单的“二房东”了。
比如,在2025年11月的测试中,顶级Neoclouds在千卡集群任务的完成时间、有效带宽利用率上,甚至超过了AWS和Azure。
而且他们部署了高度定制的Slurm和Kubernetes集群管理,专门针对大模型训练的Check-pointing(断点续传)和故障自动修复进行了优化。
传统视角看到的是“租赁”,但专业硬核视角看到的是“算力交付的极致效率”。
这种认知偏差的本质是:
你如果没有亲手Build(建造)过,你就无法理解Building的价值。
你出局了,你没有资格做咨询。
二、以“季度”为单位的咨询,以“周”为单位的AI迭代
在传统商业世界,战略规划通常以3~5年为周期,咨询报告的生产周期通常是3~6个月。
但在AI领域,“长期”的定义是6个月,“中期”是3个月,“短期”是下周。
所以,如果我们回顾麦肯锡的报告,它很大程度上是基于2024年/2025年上半年的市场的情况与数据:
那时候的Neoclouds确实以裸金属租赁为主,那时候确实是单纯的卖方市场。
但在报告撰写、审核、排版到发布的这几个月里,世界发生了什么?
答案是,发生了很多。
首先,英伟达/AMD的角色转变了,这位芯片巨头不再只是卖铲子,它们开始通过债务/股权融资直接扶持CoreWeave、Nebius等厂商,通过“算力换股权”来锁定未来的分销渠道。
再者,头部Neoclouds迅速补齐了推理服务(Inference Serving)、模型市场(Model Marketplaces)和私有光纤环网。
当这一份报告发布时,它所描述的那个世界已经不存在了。
SemiAnalysis指出的“滞后6~12个月”并非夸张。在AI领域,滞后6个月意味着你的建议是针对上一代架构(Hopper架构),而客户已经开始部署下一代(Rubin架构)了。
而与麦肯锡这样的“静态流”咨询不一样的是,像SemiAnalysis、Asianometry这样的独立机构,他们提供的是一种“动态流”(Stream)的情报服务。
他们活在Github的commit记录里,活在供应链的微信群里,活在追踪电力变电站审批记录的Excel表格里。
这种情报是碎片化的、实时的、甚至是有噪音的,但它是“活”的。
传统管理咨询的核心护城河,在于“方法论”和“框架”。其底层逻辑是:商业规律是通用的,只要掌握了思维模型,即便不懂行业细节,也能通过高层访谈得出战略结论。
但这套逻辑在半导体与AI领域彻底失效了。
如果为了追求“权威感”和“完美框架,往往导致结论的刻舟求剑。
三、NeoCloud的终局推演
既然麦肯锡的“看空”逻辑存在漏洞,那么基于2025年底的真实数据,Neoclouds的终局究竟是什么?
如果我们基于供需模型和技术演进进行推演,我们会看到一个分层(Tiered)的未来,而非二元对立的“被吞并”。
麦肯锡的核心做空逻辑是“短缺不可持续”。
一旦Blackwell/Rubin芯片海量出货,算力价格崩盘,Neoclouds将失去护城河。
但这个假设忽略了三个硬约束:
1. 电力墙(The Power Wall)
全球AI算力需求正从50~70 GW向2030年的150~250 GW迈进。但在美国,一个新的变电站审批和建设周期通常是5~7年。芯片可以造得快,但变压器和输电线不行。
Neoclouds手里锁定的电力合约(PPA),目前看起来比GPU本身更有价值。
2. 推理的大爆发
随着“思维链(Chain of Thought)”能力模型的普及,推理侧的计算量将呈10~100倍增长。这不仅消化了存量算力,还创造了巨大的增量需求。
3. 互联瓶颈
单卡性能的提升正在放缓,未来的竞争在于集群效率。
这正是CoreWeave等专精厂商优于通用云厂商(需要兼顾传统IT负载)的地方。
基于此,垂直专家们预判Neoclouds市场不会发生“大清洗”,而是会演化为三个阶层:
Tier 1:新时代的“超大规模”挑战者(2~4家)
以CoreWeave、Nebius为代表。它们将不仅仅是云厂商,而是成为类似Oracle或SAP的AI原生平台。它们拥有全栈软件能力,与微软等巨头签订了数十亿美元的“反向租赁”协议(微软租用CoreWeave算力再转卖给Azure客户)。
它们将在2026~2027年冲击IPO,市值站稳500亿美元以上。
可能最终名单就会在第二栏的公司中诞生
Tier 2:垂直领域的“利基霸主”(5~8家)
主要有主权云(Sovereign AI),比如欧洲的Nscale、中东的Tonomus,依靠数据主权法规和本地能源优势生存。
还有就是能源套利者,比如Crusoe这样利用油田伴生气或搁浅能源的厂商,其核心竞争力是极低的电力成本(0.03/kWhvs电网的0.03/kWh vs 电网的0.03/kWhvs电网的0.08/kWh)。
Tier 3:算力批发商(基础设施耗材)
也就是其余的大多数,它们将成为“基础设施耗材”,因为缺乏软件能力,最终沦为Tier 1或Hyperscalers的硬件蓄水池。
这部分确实符合麦肯锡的“低利润”预测,但它们只是生态的一部分,而非全部。
四、Skin in the Game
那为什么麦肯锡会产出这样一份与现实脱节的报告?
这还要看,谁在为这种报告买单。
长期以来,麦肯锡/Gartner的客户是财富500强的CIO、CFO。这些高管需要的是一份长达80页的、图表精美的PPT,用来在董事会上论证预算,或者作为“掩护屁股”(Cover Your Ass)的工具——“看,这是麦肯锡说的,所以我投了这个项目/砍了这个项目”。因此,报告必须显得“稳重”、“保守”,必须使用通用的商业术语,必须符合大企业的政治正确。
但类似于SemiAnalysis/垂直媒体的客户是对冲基金经理、VC合伙人、硬科技创业者。这些人是拿真金白银在下注。他们不需要漂亮的排版,他们需要的是Alpha(超额收益)。如果Dylan Patel说错了,基金经理会亏钱,他的订阅费会归零。这种“Skin in the Game(利益攸关)”的机制,逼迫垂直分析师必须追求极致的准确和前瞻。
而且,传统咨询往往倾向于将问题“框架化”,制造焦虑,然后贩卖一个有故事吸引力的解决方案。
但硬科技领域的真相往往是反直觉的、具体的、甚至枯燥的(比如讨论液冷板的流阻率),这中间没有故事,只有数据。
在AI时代,我们需要“Skin in the Game(利益攸关)”的咨询机制。
在这场关于Neoclouds的争论中,我们TOP创新区研究院看到的是——科技商业分析话语权的转移。
在Web 2.0时代或消费互联网时代,通用的商业逻辑或许足以解释世界。但在AI与半导体主导的Hard Tech时代,壁垒不仅在于资金,更在于认知颗粒度。
对于我们聪明的读者,这也是一个提醒:
不要迷信那些印着著名Logo的“宏大叙事”,因为真相往往隐藏在那些虽然排版粗糙、但数据详实的GitHub Readme里,隐藏在Discord的深夜讨论中,隐藏在像SemiAnalysis这样敢于对权威说“Bullshit”的垂直研究里。
您觉得呢?
本文来自微信公众号:TOP创新区研究院,作者:TOP创新区研究院、FTA Group
原文链接:https://www.huxiu.com/article/4812964.html?f=rss