科技快讯-K

移动端轻量化 AI 模型的算力优化策略

手机芯片厂商本周集中发力，针对 NPU（神经网络处理单元）进行了底层协议优化，专门用于支持端侧大模型。这种优化策略的核心是“异构任务调度”：让模型在 CPU、GPU 与 NPU 之间智能切分工作量，从而在保证大模型推理速度的同时，极大延长移动设备的续航。这标志着端侧AI体验已进入了“算力分配竞争”阶段。

Mobile Hardware Review
2026-04-25

参与讨论

×

正在为您生成精美海报...

移动端轻量化 AI 模型的算力优化策略

手机芯片厂商本周集中发力，针对 NPU（神经网络处理单元）进行了底层协议优化，专门用于支持端侧大模型。这种优化策略的核心是“异构任务...

希望看到您的想法，请您发表评论x