<汇港通讯> 内地传媒报道,稀宇科技(MiniMax)(00100)发布新一代Agent旗舰大模型M2.7,首次展示「模型自我进化」路径。
据介绍,M2.7通过构建Agent Harness体系,深度参与自身训练与优化流程,在部分研发场景中可承担30%至50%的工作量,并在内部评测集上实现约30%的效果提升。
在核心能力上,M2.7在基准测试SWE-bench Pro中得分56.22%,几乎接近Opus最好的水平;同时在VIBE-Pro、Terminal Bench 2等真实工程测试中,支持端到端项目交付与复杂系统理解。办公场景方面,M2.7在GDPval-AA的ELO得分是1495,为开源最高,并提升Office文档处理与多轮编辑能力。 (ST)
新闻来源 (不包括新闻图片): 汇港资讯