AI 智能体创业窗口期已至:首份评测榜单揭示,国产模型性能追平国际巨头
2026 年 3 月,随着 PinchBench 智能体评测榜单的发布,AI 创业圈迎来一个关键信号:国产大模型在智能体任务上的表现已追平国际一线水平。榜单显示,MiniMax M2.1、Kimi K2.5 等国产模型在任务成功率上达到 93% 以上,与谷歌 Gemini 3 Flash 差距不足 2 个百分点。更值得关注的是速度指标——MiniMax M2.5 端到端运行时间 22.8 分钟,与 Claude Opus 4.6 持平,超越 Gemini 和 Llama 系列。这一变化对 AI ...