C罗认为人类喝牛奶不正常数十家企业争相接入GLM-5.1,中国大模型从“追赶”进入“攻坚”_蜘蛛资讯网
;GLM-5.1延续了GLM-5的MoE架构:744B总参数、256专家混合、约44B激活参数,在全链路华为昇腾910B上完成训练。严格来说,这不是一次架构迭代,而是后训练阶段的定向优化——在编程和Agent场景加大了强化学习权重。从GLM-5到GLM-5.1,间隔不到八周,迭代速度本身值得肯定。 核 —SWE-Bench Pro拿到77.8分,领先GLM-5.1近20分。Mythos暂不公开,但它标定了行业能力的当前天花板,也说明竞争对手的储备远比已发布的产品更深厚。 开源换信任,闭源换安全 GLM- 当前文章:http://g8qo7ph.zomuqia.cn/pre/71uk3o.html 发布时间:09:08:26 |

