1.GPU卡支持的数量
GPU服务器:通常支持至少4张GPU卡,主流配置有4卡、8卡等
通用服务器:最多支持4张GPU卡,具体数量取决于机架的高度和设计
2.GPU卡支持类型
GPU服务器:对GPU卡的兼容性较好,支持单宽,双宽及部分消费类的宽卡
通用服务器:主要支持单宽,双宽卡,通常无法支持更宽的消费类卡
3.机器形态
GPU服务器:通常是单节点形态,主流为4U,还有机塔互转形态,也有高端的NVlink机型是5U、6U或8U
通用服务器:形态多样,常见的有1U,2U,4U等多种规格
4.GPU与CPU拓扑
GPU服务器:支持多种拓扑结构,包括PCIE直通和扩展,适应不同的业务场景
通用服务器:通常仅支持PCIE直通,拓扑结构较为单一
5.服务器品牌
GPU服务器:品牌相对集中,主要由头部大厂和少数ODM厂家提供
通用服务器:品牌众多,市场上有很多的厂商以攒机为主,竞争激烈
6.整机功耗差距
GPU服务器:功耗较高,通常需要4KW以上的电源配置
通用服务器:功耗较低,常见配置在500W到1600W之间,一般超过2KW的不多
7.单台服务器价格
GPU服务器:价格通常是CPU服务器的2-3倍,整体成本较高,主要是取决于GPU显卡的价格
通用服务器:价格范围广泛,从1-2万到几十万不等
8.整体市场份额
GPU服务器:近年来,市场份额逐渐上升,已占据约30%的市场
通用服务器:仍然占据大部分市场份额,约70%以上
9.服务器的业务场景定位
GPU服务器:主要用于视频渲染,AI训练,科学计算等高性能计算任务
通用服务器:更适用于网站托管、数据库管理等多种通用计算任务
10.液冷技术需求
GPU服务器:功耗高,液冷技术的需求迫切,以降低PUE指标
通用服务器:液冷技术上的需求相对较低,结构也更简单
所以在选择数据中心进行服务器托管的时候,相对于通用服务器来说,GPU服务器有以下几个更高的要求:
电力供应稳定
GPU服务器是高功率设备,需要稳定的电力供应。例如,RTX 4090 8卡单台服务器约耗电4kW,机柜的供电负荷至少不低于4kW,且应该更高,以降低用电风险。
数据中心应配备多路供电、自备发电机组等应急措施,确保在突发情况下仍能正常供电。
散热系统高效
GPU在运行过程中会产生大量热量,若散热不够时,将导致GPU芯片温度升高,GPU主频会下降效率降低,严重影响服务器的性能和寿命。
液冷技术需求
GPU服务器都是“电老虎”,也是智算中心降低PUE指标的关键,因此目前很多在建或者准备建设的智算中心都规划了GPU服务器的液冷(冷板和浸没式的都有)
IDC专员1