AGI-Eval | AI超级导航 | Deep123 | AI工具合集

AI模型评测

AGI-Eval

AI大模型评测社区

链接直达手机查看

AGI-Eval是上海交通大学、同济大学、华东师范大学、DataWhale等高校和机构合作发布的大模型评测社区，旨在打造公正、可信、科学、全面的评测生态，以“评测助力，让AI成为人类更好的伙伴”为使命。专门设计用于评估基础模型在人类认知和问题解决相关任务中的一般能力。AGI-Eval通过这些考试来评估模型的性能，与人类决策和认知能力直接相关。衡量模型在人类认知能力方面的表现，有助于了解在现实生活中的适用性和有效性。

相关导航

发表回复取消回复

相关导航

发表回复 取消回复

发表回复取消回复