近日,智谱新发布的多模态大模型GLM-4.1V-Thinking登顶 HuggingFace Trending榜单全球第一。
GLM-4.1V-Thinking是一款支持图像、视频、文档等多模态输入的通用推理型大模型,专为复杂认知任务设计。它在GLM-4V架构基础上引入“思维链推理机制(Chain-of-Thought Reasoning)”,采用“课程采样强化学习策略(RLCS, Reinforcement Learning with Curriculum Sampling)”,系统性提升模型跨模态因果推理能力与稳定性。
其轻量版 GLM-4.1V-9B-Thinking 模型参数控制在 10B 级别,在兼顾部署效率的同时实现性能突破。该模型在 MMStar、MMMU-Pro、ChartQAPro、OSWorld 等 28 项权威评测中,有 23 项达成 10B 级模型的最佳成绩,其中 18 项更是持平或超越参数量高达 72B 的 Qwen-2.5-VL,充分展现了小体积模型的极限性能潜力。
GLM-4.1V-9B-Thinking 标志着 GLM 系列视觉模型实现从感知走向认知的关键跃迁。