九游娱乐app官方网站机柜
联系我们
新闻资讯
九州ku酷游网娱乐:
过去几年,全球算力建设的热潮几乎全部集中在以GPU为代表的并行计算硬件上。绝大部分企业和投资者的注意力被这类芯片的快速地增长所吸引,传统通用计算服务器的采购预算被大幅压缩。服务器的升级换代周期,也从以往三年左右的中等水准,被动拉长到了四年甚至五年以上。这种资源倾斜也反映在产业链的利润分布上。英伟达从2023年至今连续多个季度实现快速地增长,复合年增长率达到了131%。同期,英特尔旗下的数据中心与AI事业部收入从2022年的192亿美元小幅下降到了2025年的186亿美元,增长几乎陷入停滞。
但进入2026年后,全球通用处理器市场出现了罕见的多轮涨价。价格持续上涨从消费级产品开始,随后迅速蔓延至企业级数据中心市场。英特尔和AMD已经多次上调全系列CPU的价格,平均涨幅达到15%,部分高端型号的涨幅更高。同时,两家公司2026年的全年产能,基本上已经提前预售完毕。
这种供需紧张局面的出现,背后有其深层原因,它反映的是AI应用范式的一次重要变化。下文将围绕这一变化展开,梳理不一样计算任务中的耗时与能耗数据,分析数据中心架构的调整方向,并整理主流芯片厂商的最新动向及相关受益公司。
目前市场的注意力正从大语言模型的预训练阶段,逐步转向强化学习和智能体应用。在过去的预训练范式下,通用处理器在总系统中的角色相对边缘。它的主要工作包括数据存储管理、数据分片、索引以及多模态任务中的图像视频解码。这些任务中有相当一部分可以被专用硬件接管,因此CPU在算力基础设施中的价值长期被低估。
智能体(Agentic AI)的出现彻底改变了这一局面。与传统的单次提问、单次回答不同,智能体系统要执行一个复杂的推理循环。系统要观察环境信息、做出决策、调用外部工具,然后接收反馈并进入下一轮循环。单个任务在执行过程中,经常包含数次甚至数十次内部调用。
在这个流程中,CPU需要频繁执行代码编译、沙箱环境管理、JSON格式解析、网络接口路由等控制流任务。CPU的并发解决能力、内存带宽以及任务调度效率,直接决定了总系统端到端的响应延迟和任务吞吐量。一旦并发请求量超过了传统CPU的承载上限,就会出现请求队列堆积、工具调用超时、多轮推理延迟飙升等问题,进而拖累GPU推理资源的利用率。
为了量化这种变化带来的实际压力,佐治亚理工学院与英特尔在2025年联合发布了一项针对不一样类型智能体任务的研究。以下是几组关键数据。
研究人员选取了三类典型场景:企业内部知识库检索、联网搜索智能体,以及重度科研任务。在这三类任务中,CPU的耗时占比均超过总耗时的80%。具体来看,知识库检索主要耗时在文档解析和向量数据库的高频调度;联网搜索的瓶颈在于网络请求和I/O数据等待;科研任务的计算则集中在分子模拟、物理仿真等传统科学计算上。
当大批量任务并发执行时,上述三类任务的CPU能耗占比分别达到61%、57%和60%。这在某种程度上预示着,即便GPU负责核心的模型推理,总系统的电力消耗中仍有超过一半来自通用计算部分。
GPU具备很强的并发扩展能力。当任务的并发批处理规模从64扩展到128时,GPU端的推理平均延迟保持相对来说比较稳定。而CPU在同一过程中的平均延迟却猛增了近200%。这说明在处理高密度并发任务时,CPU的并行化效率远低于GPU。
造成上述差距的原因,源于CPU与GPU在计算特性上的本质不同。GPU处理的是连续的大规模矩阵乘法,这些运算可以充分的利用低精度量化(如INT8、INT4甚至1比特)和混合专家模型稀疏化技术,在模型参数规模膨胀的情况下,实际计算负担仅增加一到两倍。通过量化和稀疏化,GPU能够得到乘数级的优化效果。
但CPU负责的任务完全不同。在智能体系统中,CPU需要处理API调用、JSON解析、环境编排、系统调度等控制流任务。这些任务具有严格的因果串行逻辑。举个例子,系统必须等待外部API返回结果,才能进行下一步推理。这类任务无法通过降低计算精度来压缩运算量,也无法借助稀疏化来跳过计算步骤。CPU的运行效率,基本取决于硬件本身的性能提升和资本支出带来的算力扩容。
这种特性可以用阿姆达尔定律来解释。阿姆达尔定律指出,一个系统的理论加速比受限于其中无法并行的串行部分所占的比例。当智能体任务中的串行执行比例超过10%时,整个AI系统的理论加速上限就被锁定在十倍以内。随着AI应用从预训练转向多智能体复杂编排,任务流中的逻辑控制与沙箱隔离操作大幅度的增加了串行比例,CPU因此成为系统性能的核心制约因素。
不同的智能体应用场景,对CPU硬件提出的需求并不相同,甚至存在很明显的分化。
在企业私有知识库检索(RAG)场景中,核心工作负载是对海量文档进行解析、文本切片以及向量数据库的频繁I/O调度。这类任务的瓶颈在于内存带宽和三级缓存的大小,字符串处理属于高度离散的任务,极度依赖内存读取速度。
在自动化软件工程(Coding)场景中,系统必须在毫秒级别启动一个隔离的沙箱环境,瞬间完成Linux内核解压、虚拟网卡挂载和内存页分配。大量微型代码任务并发涌入时,CPU会陷入频繁的用户态与内核态切换以及特权级验证,引发严重的内部损耗。这类场景需要的是高密度、高并发、微内核设计的新型CPU。
在联网搜索场景中,CPU需要维持高并发的URL抓取请求,剥离网页代码结构,并执行轻量级的文本过滤。系统的大量算力实际上被闲置在等待网络响应的过程中,而非结构化文本的清洗也极其消耗时钟周期。网络I/O和解析损耗成为主要瓶颈。
为了保障安全性和资源隔离,大部分复杂智能体任务必须在沙箱中运行。而沙箱本身的维护就会带来额外的CPU性能开销,通常在20%到30%之间。沙箱不能随意关闭,一旦关闭,其内存空间中保存的上下文信息就会被立即回收,导致状态丢失和严重的I/O延迟。目前行业内存在多种沙箱技术,包括标准容器(RunC)、软件级沙箱(gVisor)、硬件级虚拟机(Kata Containers)以及为Serverless场景优化的极简虚拟机(Firecracker)。每种技术的资源开销和启动速度各不相同,但无论选择哪一种,沙箱的频繁启停都会对内存寻址和线程调度产生巨大压力。
CPU需求的激增,正在倒逼数据中心物理架构做调整。这种调整分为两个层面:机柜内部CPU与GPU的配比变化,以及机柜外部独立CPU计算集群的部署。
配比提升有三个直接原因。第一,新一代GPU的算力比前代提升了数倍,需要更加多的CPU调度指令来保证每个GPU核心能在纳秒级获得数据吞吐。第二,增加CPU数量能扩大系统的准显存容量,支持更大规模的长短期记忆存放。第三,投机解码、前缀缓存等推理优化算法,把更多的计算逻辑转移到了CPU上执行。
除了机柜内部的变化,智能体时代还催生了大量的独立CPU服务器节点。这些节点作为调度中枢,专门负责运行智能体框架、维护沙箱环境、执行代码编译等任务。Arm公司的首席商务官Haas指出,在传统AI负载下,每吉瓦的数据中心容量大约需要3000万个CPU核心。而在智能体时代,这一需求将激增至每吉瓦一亿两千万颗核心。英特尔在2026年第一季度财务报表电话会上也表示,未来的CPU与GPU配比将从目前的8:1演进至1:1。
微软位于威斯康辛州的Fairwater数据中心已经采用了物理分离的设计。该中心由两栋独立建筑组成:一栋是高密度GPU集群,容量约为300兆瓦,另一栋是独立的风冷CPU和存储集群,容量为48兆瓦,包含数PB存储空间和数百万个CPU核心。两个区域通过超过300Tb/s的高速AI广域网连接。目前微软正在筹备更大规模的第三期工程,单个集群容量将超过600兆瓦,配套的CPU和存储资源相比标准方案直接翻倍。
从供给端来看,全球高端制程产能的分配具有明确的优先级。台积电的3纳米和2纳米产线已经持续满载,产能优先分配给毛利率更高的GPU和AI专用芯片,服务器CPU的排产被延后。英特尔作为垂直整合制造厂商,过去两年因为自身财务情况不佳导致资本开支减少,影响了新增产能的释放。为了应对服务器CPU的需求量开始上涨,英特尔只能将部分原本用于个人电脑的晶圆和后段封装产能向服务器端转移。但即便如此,也难以填补当前的缺口。英特尔的18A新制程虽然被视为未来的主要发力点,但目前仍处于良率爬坡期,尚未达到规模化量产的水平。
从需求端来看,北美三大云厂商的最新财报均超预期上调了全年资本开支指引,明确强调AI基础设施的持续投入。戴尔和HPE也在财报中确认,通用服务器和AI服务器的未交付订单创下历史上最新的记录。同时,内存等核心零部件价格连续多个季度大面积上涨。为防止整机造价进一步失控,服务器制造商和大规模最终用户被迫提前大批量扫货,以锁定成本。渠道端也从常规的按需采购转向超额备货,进一步抽干了市场的成熟产品库存。
云端扩容的真实需求,加上渠道商提前囤货的行为,两者叠加,导致高端服务器CPU的供应完全跟不上需求。这种缺货状态预计将持续到2026年下半年甚至更久。
NVIDIA在2026年3月的GTC大会上推出了Vera CPU及其独立机架。Vera CPU采用88核自研架构,引入了空间多线程技术,通过物理分区资源而非传统的时间分片来运行双线GB/s的均匀内存带宽。搭载256颗Vera CPU的独立机架,能支持超过22500个并发独立沙箱环境。该产品预计在2026年下半年进入生产部署阶段,CoreWeave将成为首批采用这一方案的云服务商。
Arm也在2026年3月推出了其首款自主研发的AGI CPU,这标志着Arm商业模式的重大转变。Arm不再仅仅提供指令集授权或公版核心IP,而是直接向云厂商与服务器厂商销售自研芯片。第一代AGI CPU已经上市,Arm预计该产品在2027财年和2028财年将创造10亿美元的收入。第二代芯片计划在2027年推出,公司预计到2031年,AGI CPU产品的年营收将增长到150亿美元,约占公司当年250亿美元营收目标的60%。
大型云服务商同样在加速自研CPU的步伐。AWS作为最早推出自研CPU的云厂商,于2016年推出了首款Graviton芯片。2025年12月,AWS发布了基于台积电3纳米工艺的Graviton 5,提供192核配置。自研Graviton CPU已经连续三年占据AWS新增EC2算力的50%以上。微软在2023年11月推出了采用台积电5纳米工艺的Cobalt 100 CPU,2025年11月又推出了采用3纳米工艺的下一代Cobalt 200,提供132核配置。谷歌则于2024年4月推出了首款自研CPU Axion C4A,集成自研IPU,将网络与存储I/O处理从CPU卸载至独立硬件。2026年,谷歌计划推出裸金属版本以及下一代Axion N4A系列。
在传统的x86阵营,英特尔和AMD依然把控着核心市场,依托成熟的虚拟化底座、极高的单线程稳定性以及庞大的应用生态。
英特尔未来两年的主要发力点是18A和14A制程。18A通过引入背面供电技术和GAA全环绕栅极架构,将供电网络移至晶圆背面,解决了信号干扰问题,同时能在极高负载下维持更高的时钟频率。根据英特尔在2026年4月财报电线A良率预计将在年中提前达到年初设定的目标。公司还披露,特斯拉已确认采用英特尔14A制程,谷歌也签署了3到5年的战略合作协议,部署Xeon 6实例并联合研发ASIC。
AMD的产品路线图高度绑定台积电的先进制程。公司确认Zen 6将是业界首款采用台积电2纳米制程的处理器,预计在2026年下半年发布。Zen 6和Zen 6C都将受益于每时钟周期指令数的提升,获得更高的性能表现。后续的Zen 7预计在2027至2028年间发布,将首次搭载新矩阵引擎,具备更强大的AI加速功能。
根据上述分析,AI技术正从大模型预训练转向智能体和强化学习,这一变化带动了CPU需求的明显增长,同时对CPU的性能也提出了更加高的要求。无论是X86还是Arm架构的厂商,都在从中受益。再加上信创政策的推动,国内那些拥有成熟生态和先发优势的CPU厂商,将成为这一轮增长的主要受益者。
CPU数量的增加将系统性地拉动内存接口芯片的需求基数。DDR5内存在超高频运行下对信号完整性、供电精度及热管理有极高要求,单根内存条所绑定的配套器件如电源管理芯片、串行检测芯片等用量将同比例增长。同时,CXL协议及内存扩展控制器成为实现内存池化的必然路径。
CPU需求增加将拉动本土服务器OEM/ODM厂商的出货量。在当前全球CPU产能错配、持续缺货及涨价的背景下,具备强大供应链备货能力及规模优势的龙头厂商有望获得更高的市场占有率。
- 上一篇: 中电长城请求服务器与服务器机柜专利提高散热模块的散热面积
- 下一篇: 建材部品-新闻中心-房讯网
相关产品
-
官厅湖畔建起算力“超级大脑”
-
AI 算力年代迸发IDC 职业迎来全新掘金时机
-
海康威视新“机柜”外观专利:带摄像监控报警二合一
-
音讯称鸿海全光 CPO 交流机柜“一机不剩”悉数出货给英伟达
-
X86服务器_服务器频道_天极网
-
天极网_专业IT门户

