谷歌为 Gemma 4 系列 AI 模型推出 MTP 起草器,推理速度最高提升 3 倍
谷歌于5月5日发布博文,宣布为Gemma4系列AI模型,推出多Token预测(MTP)起草器,利用推测解码架构,推理速度最高可提升3倍。
[查看原文]
该资讯由价美丽收集整理,来源于网络,价美丽致力于为淘宝、京东、拼多多等商家提供推广服务,助力店铺实现快速起店、精准测品,高效解决店铺运营难题,加速店铺成长,轻松打开市场!
谷歌于5月5日发布博文,宣布为Gemma4系列AI模型,推出多Token预测(MTP)起草器,利用推测解码架构,推理速度最高可提升3倍。
[查看原文]