面向真实复杂任务场景，蚂蚁Ring-2.6-1T 正式发布

2026年5月9日技术趋势 mingzhi

蚂蚁正式发布 Ring-2.6-1T，一款面向真实复杂任务场景打造的万亿级旗舰思考模型。

随着大模型逐步进入 Agent、工程开发、科研分析与企业工作流等真实生产环境，行业对“推理能力”的需求正在发生变化：并非所有任务都需要同等级别的思考深度。一次简单的格式转换，与一道复杂数学竞赛题，对推理资源的要求截然不同。

因此，Ring-2.6-1T 引入可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，让开发者能够根据任务复杂度灵活控制模型思考深度，在效果、速度与成本之间取得更优平衡。其中，

在真实任务执行类评测中，Ring-2.6-1T high 表现突出：

PinchBench 得分 87.60，显著高于 GPT-5.4 xHigh、Gemini-3.1-Pro high 与 Claude-Opus-4.7 xhigh；ClawEval 得分 63.82，在可比模型中位居前列；Tau2-Bench Telecom 达到 95.32，与最高分模型差距不足 1 分，体现出其在复杂业务流程、工具协作与行业任务中的稳定执行能力。

在高难推理任务上，Ring-2.6-1T xhigh 展现出更高能力上限：

ARC-AGI-V2 得分 77.78，与 Gemini-3.1-Pro high 和 Claude-Opus-4.7 xhigh处于同一水位；AIME 26 得分 95.83，接近多家头部模型水平；GPQA Diamond 达到 88.27，体现出稳健的科学知识理解与复杂推理能力。

总体来看，Ring-2.6-1T 希望解决的不只是“模型是否足够聪明”，更是“模型能否以合理推理成本，在真实复杂工作流中稳定、高效地完成任务”。

目前，Ring-2.6-1T 已上线 OpenRouter（https://openrouter.ai/inclusionai/ring-2.6-1t:free），并开放限时一周免费体验。可在 Agent、Coding 与复杂工作流场景中进行真实测试与反馈。模型也将在近期正式开源。