据月之暗面官网称,Kimi K2 Thinking在评估推理、编码和代理能力的基准测评中创造了新的记录。K2 Thinking在HLE基准评测中取得44.9%的SOTA成绩,在BrowseComp测试中达到60.2%,在SWE-Bench Verified测试中达到71.3%,显示出作为最先进的思考代理模型的强大泛化能力。
QQ咨询
电话咨询
返回顶部