|
![]() 出品 | 妙投APP 作家 | 张博 裁剪 | 丁萍 头图 | AI生图 畴昔两年,AI产业最强的叙事简直皆围绕GPU伸开。 从OpenAI掀翻大模子波澜,到市值飙升,再到云厂商、互联网平台和创业公司争抢高端算力,GPU被塑变成AI期间最稀缺的“硬通货”。谁领有更多GPU,谁就更接近模子才气上限,谁能搭起更大考试集群,谁就更像拿到了下一代AI的门票。 在这套叙事中,CPU莫得灭绝,但明显退居幕后。它仍然是工作器的基础部件,是操作系统、、汇注和应用运行的底座,却不再是AI故事里的主角。市集以致形成了一种近乎默许的判断:AI期间,GPU吃肉,CPU喝汤。 但到2026年,这个判断仍是不够用了。因为AI产业正在发生一个更深层的变化:主战场正从考试竞赛,转向部署竞赛;价值重点正从峰值算力,转向系统后果。 这意味着,确切决定AI交易化速率的,不再仅仅GPU能把模子训得多大、多快,而是整套系统能否以可控成本、安详朦拢和高应用率,把模子确切跑起来、用起来、赚到钱。 一朝竞争从“单卡性能”转向“端到端后果”,CPU就不再仅仅破裂,而是AI基础设施里阿谁被恒久低估的系统变量。 市集为何再行看英特尔? 不仅仅因为财报,而是因为需求结构变了。 最近一个值得介意的信号,是英特尔再行取得老本市集爱护。2026年第一季度,英特尔营收约为136亿好意思元,同比增长7%,一语气第六个季度超预期;净利润同比增长156%。其中,数据中心与AI相干业务(DCAI)收入达到约51亿好意思元,同比增长22%,成为增长最快的板块。财报发布后,英特尔股价盘后最高高涨超40%(欺压4月30日)。 如果只看公司层面,这天然不及以评释英特尔仍是绝对翻身。它仍濒临制程追逐、工作器CPU份额承压、Arm浸透、云厂商自研芯片鼓动等问题。但市集照旧给了它新的思象空间,原因不在于英特尔倏得变成AI明星,而在于投资东说念主开动相识到:AI基础设施的需求结构,仍是不再仅仅“多买GPU”。 英特尔措置层在财报会上透露,数据中心中CPU与GPU的部署比例,正从传统的1:8收紧到1:4,在智能体场景中以致可能进一步向1:1聚积。 这背后的含义极端明确:畴昔两年AI行业最核心的矛盾是考试才气不及,而今天越来越多企业开动面对另一组问题,模子考试完之后,如何推理、如何部署、如何膨胀、如何欺压成本。 也即是说,老本市集再行订价的,不仅仅英特尔,而是一个更深层的事实:AI开动插足系统竞争阶段。 CPU的紧迫性从何而来? 先要回应另一个问题:为什么AI今天的核心矛盾,仍是不再仅仅考试。因为考试诚然贵,但对大多数企业来说,它更多是阶段性的老本开支;而推理、部署和调用,才是合手续性的运营开支。 考试决定模子能不可作念出来,推理决定模子能不可活下去。这一变化仍是有明确的数据支合手。 Deloitte估算,推理使命负载占AI总算力的比例在2023年约为1/3,2025年接近1/2,到2026年展望达到2/3。IDC预测,到2027年中国推理算力占举座算力比例将冲破70%。另有谈论展望,到2026年推理带来的市集限度将是考试硬件市集的2到3倍。这些数字共同评释一件事:AI的成本中心和价值中心,正在从“考试一次”转向“运行无数次”。 郑纬民院士给过一个更直白的拆分:在大模子推理成本中,东说念主力仅占3%,数据占2%,算力占到95%。他例如称,ChatGPT的推理支出每天约70万好意思元,DeepSeek V3每天约8.7万好意思元(按各自露馅口径)。 这组数据确切评释的,不是“推理也很贵”,而是一朝AI插足大限度使用阶段,确切并吞利润的不是考试账,而是推理账。国度数据局的数据进一步放大了这种压力:中国日均Token调用量从2024岁首约1000亿,跃升至2026年3月的140万亿,两年增长超千倍。 如果说考试是一次性把钱砸进去,那么推理即是每天皆在把钱烧出去。考试贵,是研提问题;推理贵,是利润问题。而一朝问题变成利润问题,企业就不可能再只盯着模子参数和GPU数目,而必须开动追问: GPU是不是被充分应用了?哪些任务必须用GPU?哪些其实应该交给CPU?整套系统的朦拢率和资源应用率到底高不高? 这恰是CPU再行变紧迫的开始。 许多东说念主融会AI基础设施,还停留在“GPU越多越好”的阶段。但实验是,今天大宗AI系统濒临的核心问题,不是GPU不够强,而是系统喂不饱GPU。 MLPerf行业基准测试炫夸,在大模子考试场景中,数据加载、预处理、参数同步等要道带来的蔓延,可占总考试时刻的35%到60%。IDC调研则炫夸,即使是头部互联网企业的AI推理集群,GPU平均应用率也恒久低于40%;大宗中小企业的GPU集群应用率以致不及15%。 这意味着什么? 意味着今天最腾贵的AI资源,正在被大限度花消。不是因为GPU性能不行,而是因为数据流动、任务调度、内存措置、I/O协同、汇注处理这些系统要道跟不上。换句话说,GPU算得很快,但系统供给不上,扫尾即是一边拚命买卡,一边大面积闲置。 这亦然为什么CPU的紧迫性,乐鱼体育官方网站不是“多卖少许工作器芯片”那么通俗,而是它平直决定AI系统的资源应用率和ROI。 因为在确切使命流里,GPU从来不是单独使命的。它前边稀有据准备,后头有扫尾处理,中间有任务调度、缓存缓助、辗转文切换、汇注通讯、容器措置、数据库交互。这些要道里,确切承担欺压流和系统协同的,主淌若CPU。 是以问题的本体不是“CPU能不可替代GPU”,而是如果CPU和系统层才气跟不上,再强的GPU也仅仅腾贵的闲置金钱。 智能体兴起,让CPU从“底座”变成“核心” 如果说推理阶段让CPU再行紧迫,那么智能体(Agent)的兴起,则把这种紧迫性进一步放大。 因为智能体不是一个“更会聊天”的模子,而是一套确切要实行任务的系统。它要融会决议、拆解步伐、调用器具、造访数据库、联结API、实行代码、缓助气象、判断扫尾,必要时还要调用其他模子或子Agent协同。 在这条链路中,模子推理仅仅其中一环。大宗使命并不是“算”,而是“调度”“编排”“切换”“造访”“措置”。这些使命本体上皆属于欺压流和系统协同,而这恰是CPU最擅长的边界。 康奈尔大学的谈论炫夸,在五类代表性Agent使命负载中,CPU端的器具处理、逻辑调度和数据预处理,占总端到端蔓延的比例高达43.8%到90.6%。在典型的RAG场景中,CPU处理以致可能占到总蔓延的90%以上,GPU推理反而不到10%。 这组数据的趣味趣味极端明确:在智能体期间,许多确切任务的瓶颈仍是不是GPU算得够不够快,而是CPU能不可把整条任务链顺畅地跑完。 这也解说了为什么CPU/GPU配比正在变化。TrendForce指出,面前AI数据中心中CPU与GPU的配比大概是1:4到1:8,而在智能体AI期间,这一比例展望将迟缓演变为1:1到1:2。当配比从1:8向1:1拘谨,本体上不是CPU多卖了几颗,而是AI基础设施从“计较中心化”转向“系统中心化”。 产业响应仍是开动出现。2026年第一季度末,Intel和AMD皆对部分CPU家具线提价,工作器CPU交期拉长至约6个月。与此同期,英伟达和Arm也在吞并时期文书贫乏工作器CPU市集。 一个是GPU巨头,一个是IP授权商,却在吞并时刻加码CPU,这评释他们看到的是吞并个趋势:异日AI的枢纽战场,不仅仅模子推理自己,而是围绕推理和智能体伸开的整机系统才气。 当所有这个词头部玩家皆在补CPU,评释竞争仍是从“单芯片”变成“系统工程”。畴昔两年,AI行业有一种很强的“单点崇拜”:比谁的芯片更强,比谁的参数更多,比谁的集群更大。这种竞争神色在产业早期开垦,因为本领冲破常常率先来自少数明星要道。 但产业一朝插足落地阶段,决定赢输的逻辑就会转变。确切拉开差距的,不再仅仅某个单点性能,而是整套系统能否以可控成本、可复制神色合手续运行。 是以今天咱们看到的,不仅仅英特尔受益,而是所有这个词紧迫玩家皆在再行补CPU、补系统、补整机才气。英特尔但愿依托数据中心生态和软件兼容,再行巩固系统层语言权;AMD则在工作器CPU市聚积手续扩大份额,Mercury Research数据炫夸,AMD EPYC工作器CPU在2025年Q4营收份额已达到41.3%,初度冲破40%。 Arm和云厂商自研CPU,则试图从高能效和定制化切入系统进口;以致连英伟达我方,也在通过Grace CPU强化对整机架构的欺压力。所有这个词顶级玩家皆在补CPU,不是因为CPU倏得变得性感,而是因为AI开动从芯片问题,变成系统问题。 如果把视角拉回中国,这轮变化的实验趣味趣味更大。中国事专家AI应用落地最快的市集之一。欺压2026年3月,我国日均Token调用量已冲破140万亿;IDC数据炫夸,2025年中国AI加快卡总出货约400万张,其中国产厂商出货165万张,占比41%。 这评释,中国AI仍是不再仅仅“模子热”“算力热”,而是插足了确切的“调用热”和“部署热”。这会把中国企业推向一个更实验的问题:AI不是能不可作念,而是作念了之后能不可恒久跑、能不可算得过来。 第一,是成本压力。 某制造企业在将智能体接入出产线时发现,每个决策步伐的推理成本高达0.3好意思元,是传统限定系统的20倍。这类案例确切评释的,不是智能体太贵,而是:如果系统架构不优化,AI很容易从出产力器具变成成本黑洞。 第二,是兼容压力。 中国企业现存IT系统复杂,数据库、ERP、CRM、OA、工业系统恒久并存。AI如果要确切插足业务过程,必须与这些存量系统深度交融。这意味着企业需要的不是单一“最强模子”,而是一套能把模子、数据库、API和业务系统串起来的基础设施,而CPU承担的恰是兼容、调度和运行时支合手扮装。 第三,是自主可控。 跟着AI部署长远,国产CPU、工作器、操作系统、数据库、中间件和调度软件,皆会被再行放到更靠前的位置。也即是说,CPU再行紧迫,不仅仅国外巨头的契机,也可能成为中国基础设施产业链的一次再估值窗口。 是以,如果把视角再拉长少许,就会发现,CPU在AI中的再行紧迫,其实仅仅形态。更深层被再行订价的,是系统才气。 本文来自虎嗅,原文衔接:https://www.huxiu.com/article/4855067.html?f=wyxwapp 金沙电玩城app官方下载 |



备案号: