月之暗面开源 K2 Vendor Verifier,用于评估 API 供应商的调用能力
月之暗面(moonshot ai)近日推出了一款名为 k2 vendor verifier(k2vv) 的开源工具。该项目专注于帮助开发者更直观地评估各类推理服务提供商在工具调用(tool call)任务中的准确率表现。
团队注意到,尽管多个 API 服务商均宣称基于 Kimi K2 开源模型提供服务,但在实际的工具调用能力上却存在显著差异。为此,月之暗面开展了系统性测试,并决定将测试工具开源,以提升行业透明度。

目前,该工具已接入模型聚合平台 OpenRouter。用户可通过其提供的可视化界面,实时查看各服务商的性能对比数据,并据此选择最符合自身应用需求的后端支持。
项目开源地址:https://www.php.cn/link/4992f85f02e4d718826650c96219875d
<< 上一篇
下一篇 >>
网友留言(0 条)