硬科技时代,我们到底需要怎么样的咨询?

admin 2025-12-03 06:54 0 次点击
本文来自微信公众号:TOP创新区研究院,作者:TOP创新区研究院、FTA Group,原文标题:《当麦肯锡遭到质疑:硬科技时代,我们到底需要怎么样的咨询?》,题图来自:AI生成 前不久,麦肯锡McKinsey发布了的一份关于“Neoclouds(新兴AI云服务商)”的报告,喏,就是下面这一篇。 但随后,在X(原Twitter)和硅谷硬核的Discord群组里,工程师、创始人以及像Dylan Patel这样的垂直领域分析师,对麦肯锡这份报告发出了前所未有的质疑。 知名半导体分析机构SemiAnalysis甚至还对报告进行了近乎残酷的拆解,注意看highlight的部分,咱们就不翻译了。 批评声音非常尖锐: “一群从未焊过电路板、从未在机房通过宵的MBA,凭什么用精美的PPT来指导这场人类历史上最复杂的算力基建革命?” 这场争论的背后,其实是一个深刻的行业变局: 在极度垂直、极度复杂、极度快速的硬科技时代,传统的“通用型智库”正在遭遇前所未有的信任危机。 我们也开始思考: 在AI深水区,我们究竟需要什么样的行业洞察? 一、你没有build过,你就没有资格 回到上面我们说到的那份关于CoreWeave、Lambda Labs等“Neoclouds”的行业报告。 麦肯锡的结论是: 这些新兴云厂商只是“昙花一现的套利者”,终将被Hyperscalers(超大规模云厂商)吞噬。 每家机构的看法观点都不一样,这无可厚非,但问题是,其推导过程中的数据硬伤,却让一线从业者大跌眼镜。 比如,有一个细节就极具杀伤力: 麦肯锡在报告中为了论证Neoclouds资本支出过高、商业模式不可持续,隐含的假设是,每台AI服务器的成本约为69.3万美元。 然而,一线的从业者(Builders)立刻指出,基于2025年Q4的市场行情,即便是配置了8张B200/GB200的高端服务器,其真实的硬件BOM(物料清单)成本加上网络互联,大约在30万~40万美元之间。 看到了么? 这是一个高达100%的误差。 那为什么会发生这种错误? 因为咨询顾问习惯于看“公开列表价”(List Price),或者是包含了几年的服务溢价后的“打包价”,他们试图通过财务报表倒推物理成本。 而真正的行家看的是什么? 看GPU与服务器硬件:22万~28万美元。 看InfiniBand/Ethernet网络设施:4万~7万美元。 也要看电力与机柜建设(CapEx):这一部分虽然昂贵,但分摊到单台服务器的建设成本并非天文数字。 在硬科技领域,魔鬼不在细节里,魔鬼就是细节本身。 如果你的输入端数据(Input)有100%的偏差,那么你复杂的财务模型输出(Output)——关于EBITDA、关于ROI的结论——就毫无价值。 这种粒度的缺失,也导致了对商业模式的误判。 麦肯锡将Neoclouds定义为“裸金属租赁商”(Bare-metal landlords),认为它们只是在利用英伟达显卡的短缺赚取差价,技术含量极低,利润微薄(估算约8%的息税前利润)。 但垂直领域的专家看到的是完全不同的图景: SemiAnalysis的最新数据显示,CoreWeave等头部玩家的毛利率在签署长期保留合约(Reserved Contracts)时可达45%~55%。 更重要的是,这些厂商早就不是简单的“二房东”了。 比如,在2025年11月的测试中,顶级Neoclouds在千卡集群任务的完成时间、有效带宽利用率上,甚至超过了AWS和Azure。 而且他们部署了高度定制的Slurm和Kubernetes集群管理,专门针对大模型训练的Check-pointing(断点续传)和故障自动修复进行了优化。 传统视角看到的是“租赁”,但专业硬核视角看到的是“算力交付的极致效率”。 这种认知偏差的本质是: 你如果没有亲手Build(建造)过,你就无法理解Building的价值。 你出局了,你没有资格做咨询。 二、以“季度”为单位的咨询,以“周”为单位的AI迭代 在传统商业世界,战略规划通常以3~5年为周期,咨询报告的生产周期通常是3~6个月。 但在AI领域,“长期”的定义是6个月,“中期”是3个月,“短期”是下周。 所以,如果我们回顾麦肯锡的报告,它很大程度上是基于2024年/2025年上半年的市场的情况与数据: 那时候的Neoclouds确实以裸金属租赁为主,那时候确实是单纯的卖方市场。 但在报告撰写、审核、排版到发布的这几个月里,世界发生了什么? 答案是,发生了很多。 首先,英伟达/AMD的角色转变了,这位芯片巨头不再只是卖铲子,它们开始通过债务/股权融资直接扶持CoreWeave、Nebius等厂商,通过“算力换股权”来锁定未来的分销渠道。 再者,头部Neoclouds迅速补齐了推理服务(Inference Serving)、模型市场(Model Marketplaces)和私有光纤环网。 当这一份报告发布时,它所描述的那个世界已经不存在了。 SemiAnalysis指出的“滞后6~12个月”并非夸张。在AI领域,滞后6个月意味着你的建议是针对上一代架构(Hopper架构),而客户已经开始部署下一代(Rubin架构)了。 而与麦肯锡这样的“静态流”咨询不一样的是,像SemiAnalysis、Asianometry这样的独立机构,他们提供的是一种“动态流”(Stream)的情报服务。 他们活在Github的commit记录里,活在供应链的微信群里,活在追踪电力变电站审批记录的Excel表格里。 这种情报是碎片化的、实时的、甚至是有噪音的,但它是“活”的。 传统管理咨询的核心护城河,在于“方法论”和“框架”。其底层逻辑是:商业规律是通用的,只要掌握了思维模型,即便不懂行业细节,也能通过高层访谈得出战略结论。 但这套逻辑在半导体与AI领域彻底失效了。 如果为了追求“权威感”和“完美框架,往往导致结论的刻舟求剑。 三、NeoCloud的终局推演 既然麦肯锡的“看空”逻辑存在漏洞,那么基于2025年底的真实数据,Neoclouds的终局究竟是什么? 如果我们基于供需模型和技术演进进行推演,我们会看到一个分层(Tiered)的未来,而非二元对立的“被吞并”。 麦肯锡的核心做空逻辑是“短缺不可持续”。 一旦Blackwell/Rubin芯片海量出货,算力价格崩盘,Neoclouds将失去护城河。 但这个假设忽略了三个硬约束: 1. 电力墙(The Power Wall) 全球AI算力需求正从50~70 GW向2030年的150~250 GW迈进。但在美国,一个新的变电站审批和建设周期通常是5~7年。芯片可以造得快,但变压器和输电线不行。 Neoclouds手里锁定的电力合约(PPA),目前看起来比GPU本身更有价值。 2. 推理的大爆发 随着“思维链(Chain of Thought)”能力模型的普及,推理侧的计算量将呈10~100倍增长。这不仅消化了存量算力,还创造了巨大的增量需求。 3. 互联瓶颈 单卡性能的提升正在放缓,未来的竞争在于集群效率。 这正是CoreWeave等专精厂商优于通用云厂商(需要兼顾传统IT负载)的地方。 基于此,垂直专家们预判Neoclouds市场不会发生“大清洗”,而是会演化为三个阶层: Tier 1:新时代的“超大规模”挑战者(2~4家) 以CoreWeave、Nebius为代表。它们将不仅仅是云厂商,而是成为类似Oracle或SAP的AI原生平台。它们拥有全栈软件能力,与微软等巨头签订了数十亿美元的“反向租赁”协议(微软租用CoreWeave算力再转卖给Azure客户)。 它们将在2026~2027年冲击IPO,市值站稳500亿美元以上。 可能最终名单就会在第二栏的公司中诞生 Tier 2:垂直领域的“利基霸主”(5~8家) 主要有主权云(Sovereign AI),比如欧洲的Nscale、中东的Tonomus,依靠数据主权法规和本地能源优势生存。 还有就是能源套利者,比如Crusoe这样利用油田伴生气或搁浅能源的厂商,其核心竞争力是极低的电力成本(0.03/kWhvs电网的0.03/kWh vs 电网的0.03/kWhvs电网的0.08/kWh)。 Tier 3:算力批发商(基础设施耗材) 也就是其余的大多数,它们将成为“基础设施耗材”,因为缺乏软件能力,最终沦为Tier 1或Hyperscalers的硬件蓄水池。 这部分确实符合麦肯锡的“低利润”预测,但它们只是生态的一部分,而非全部。 四、Skin in the Game 那为什么麦肯锡会产出这样一份与现实脱节的报告? 这还要看,谁在为这种报告买单。 长期以来,麦肯锡/Gartner的客户是财富500强的CIO、CFO。这些高管需要的是一份长达80页的、图表精美的PPT,用来在董事会上论证预算,或者作为“掩护屁股”(Cover Your Ass)的工具——“看,这是麦肯锡说的,所以我投了这个项目/砍了这个项目”。因此,报告必须显得“稳重”、“保守”,必须使用通用的商业术语,必须符合大企业的政治正确。 但类似于SemiAnalysis/垂直媒体的客户是对冲基金经理、VC合伙人、硬科技创业者。这些人是拿真金白银在下注。他们不需要漂亮的排版,他们需要的是Alpha(超额收益)。如果Dylan Patel说错了,基金经理会亏钱,他的订阅费会归零。这种“Skin in the Game(利益攸关)”的机制,逼迫垂直分析师必须追求极致的准确和前瞻。 而且,传统咨询往往倾向于将问题“框架化”,制造焦虑,然后贩卖一个有故事吸引力的解决方案。 但硬科技领域的真相往往是反直觉的、具体的、甚至枯燥的(比如讨论液冷板的流阻率),这中间没有故事,只有数据。 在AI时代,我们需要“Skin in the Game(利益攸关)”的咨询机制。 在这场关于Neoclouds的争论中,我们TOP创新区研究院看到的是——科技商业分析话语权的转移。 在Web 2.0时代或消费互联网时代,通用的商业逻辑或许足以解释世界。但在AI与半导体主导的Hard Tech时代,壁垒不仅在于资金,更在于认知颗粒度。 对于我们聪明的读者,这也是一个提醒: 不要迷信那些印着著名Logo的“宏大叙事”,因为真相往往隐藏在那些虽然排版粗糙、但数据详实的GitHub Readme里,隐藏在Discord的深夜讨论中,隐藏在像SemiAnalysis这样敢于对权威说“Bullshit”的垂直研究里。 您觉得呢? 本文来自微信公众号:TOP创新区研究院,作者:TOP创新区研究院、FTA Group 原文链接:https://www.huxiu.com/article/4812964.html?f=rss