科技快讯-K

移动端轻量化 AI 模型的算力优化策略

手机芯片厂商本周集中发力,针对 NPU(神经网络处理单元)进行了底层协议优化,专门用于支持端侧大模型。这种优化策略的核心是“异构任务调度”:让模型在 CPU、GPU 与 NPU 之间智能切分工作量,从而在保证大模型推理速度的同时,极大延长移动设备的续航。这标志着端侧AI体验已进入了“算力分配竞争”阶段。