AI大模型评测社区
AGI-Eval是上海交通大学、同济大学、华东师范大学、DataWhale等高校和机构合作发布的大模型评测社区,旨在打造公正、可信、科学、全面的评测生态,以“评测助力,让AI成为人类更好的伙伴”为使命。专门设计用于评估基础模型在人类认知和问题解决相关任务中的一般能力。AGI-Eval通过这些考试来评估模型的性能,与人类决策和认知能力直接相关。衡量模型在人类认知能力方面的表现,有助于了解在现实生活中的适用性和有效性。
上海人工智能实验室推出的大模型开放评测体系
Hugging Face推出的开源大模型排行榜单
智源研究院推出的FlagEval大模型评测平台
一个全面的中文基础模型评估套件
全方位的多模态大模型能力评测体系
清晰展示30多款大模型的关键指标
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
Δ
上海人工智能实验室推出的大模型开放评测体系