LLM Benchmark Dashboard
基于个人私有题目的大模型长期跟踪测评项目(
GitHub
)
数据类别
数据集
模型模式
搜索
请选择数据集开始浏览。
纵轴指标
测试成本
平均耗时