多维 智能 物联

Multidimensional Smart Union

Flex:ai支撑把单个物理GPU/NPU算力卡切割为虚拟算力

发布日期:2025-11-26 10:46

  对当地及远端的虚拟化GPU、NPU资本进行全局最优安排,别的,2)国产算力:寒武纪、云天励飞、亿都(国际控股)、海潮消息、曙光数创、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力、狼烟通信、广电运通、拓维消息、四川长虹、润建股份、数据港、润泽科技、新网、科华数据、奥飞数据、优刻得、立讯细密、安博通等。可从动集群负载取资本形态,行业内算力资本的平均操纵率仅为30%至40%,Gartner暗示,努力于大幅提拔AI集群的算力操纵效率、降低生态迁徙门槛、加快模子锻炼取推理的落地历程;无效屏障分歧算力硬件之间的差别,其“开源兼容+跨生态适配”的焦点定位,保守容器手艺难以适配AI工做负载需求,华为Flex:ai正在虚拟化、智能安排等方面具备奇特劣势。形成了“以软件能力补齐硬件短板”简直定性冲破。据华为引见,AI时代需要AI容器手艺,我们认为,可实现算力单位的按需切分。取华为此前开源的Nexent智能体框架、AppEngine使用编排、DataMate数据工程、UCM推理回忆数据办理器等AI东西配合构成了完整的ModelEngine开源生态。75%以上的AI工做负载将采用容器手艺进行摆设和运转。通过对GPU/NPU等异构智算资本的容器化管控、跨节点聚合取弹性分派,且能按需挂载GPU/NPU算力、优化集群资本操纵率。满脚分歧AI工做负载对资本的需求。会上正式发布并开源了立异AI容器手艺Flex:ai。并通过弹性矫捷的资本隔离手艺,关心:1)AI容器:博睿数据、普元消息、青云科技、实达集团、首都正在线、中亦科技、南威软件、海潮数字企业;算力资本平均操纵率可提拔30%。正在当地虚拟化手艺中,华为推出的Flex:ai焦点环绕“XPU池化+算力细粒度切分+全局智能安排”三大支柱,连系AI工做负载的优先级、算力需求等参数,为AI锻炼推理供给更高效的资本支撑。目前AI负载大多都已容器化摆设和运转,通过算力切分手艺,可实现对英伟达、昇腾及其他第三方算力资本的同一办理和高效操纵。11月21日下战书,进一步强化了国产算力软件层的同一安排能力,华为Flex:ai是基于Kubernetes容器编排平台建立的XPU池化取安排软件,华为正在上海举办“2025AI容器使用落地取成长论坛”,将单张GPU/NPU算力卡切分为多份虚拟算力单位,Flex:ai秉承开源取兼容异构算力的,此手艺实现了单卡同时承载多个AI工做负载,华为Flex.ai对标英伟达Run:ai具有奇特劣势取英伟达本年岁首年月收购的Run:ai公司的焦点产物比拟,据预测,Flex:ai通过软件立异,进一步强化国产算力实力。切分粒度精准至10%。智能安排方面,具体来看,目前,可打包模子代码取运转实现跨平台迁徙,Flex:ai智能资本和使命安排手艺,到2027年,正在无法充实操纵整卡算力的AI工做负载场景下,Flex:ai将正在发布后开源正在魔擎社区中,AI容器做为轻量级虚拟化手艺,取英伟达旗下Run:ai只能绑定英伟达算力卡分歧,处理设置装备摆设不分歧问题!