科技快讯-K Groq 宣布其 LPU 推理芯片吞吐量创纪录 AI 芯片初创公司 Groq 宣布,其最新的 LPU(语言处理单元)在处理 Llama 3 8B 模型时,推理速度突破了 每秒 1000 个 token。这种极低延迟的特性使其在实时翻译和高频交易领域备受追捧。 生成海报分享 Forbes / Groq Blog 2026-03-31 参与讨论
参与讨论