近日,阿里云宣布第八代企业级通用计算实例ECS g8i算力再升级,代号Emerald Rapids的第五代英特尔至强可扩展处理器,依托阿里云自研的「飞天+CIPU」架构体系,ECS g8i实例的整机性能最高提升85%,AI推理性能最高提升7倍,可支撑72B参数的大语言模型,帮助中小规模模型起建成本降低50%。同时新实例还提供了端到端安全防护,为企业构建可信AI应用提供强有力的隐私增强算力支撑。

阿里云弹性计算产品线总经理张献涛表示,阿里云ECS g8i实例的表现,表明以CPU为中心的计算体系同样具备加速AI推理的巨大潜力,公共云不仅可胜任超大规模的AI模型,也为AI应用加速落地开辟了新路径。阿里云将不断深耕技术、持续产品创新,为企业提供更加稳定、强大、安全、弹性的计算服务,推动各行业AI应用进入全量爆发。
英特尔中国数据中心和人工智能集团至强客户解决方案事业部总经理李亚东表示,最新上市的第五代英特尔至强可扩展处理器每个内核均内置AI加速功能,有能力处理要求严苛的AI工作负载。与上代相比,其AI训练性能提升多达29%,AI推理能力提升高达42%。希望借由阿里云第八代企业级实例(ECS g8i)共同助力开发者实现技术普惠,让AI技术无处不在。
生成式AI掀起的技术革命,正在推动计算范式发生根本性的变化。当前,AI大模型推理在算力上依然面临诸多挑战,例如首包延迟受限于并行处理能力与浮点运算能力,吞吐性能则受限于内存带宽和网络延迟。据了解,阿里云ECS g8i实例针对这些难题都进行了相当程度的优化,包括内置指令集从AVX512升级到了Intel AMX高级矩阵扩展加速技术,可让生成式AI更快地运行。相对于AVX512指令集,启用AMX AI加速后,ECS g8i 实例在int 8矩阵计算的性能最高提升7倍。




