LLMEval3

5个月前发布 20,095 11 0

由复旦大学NLP实验室推出的大模型评测基准

收录时间：

2026-03-08

打开网站手机查看

AI开发工具 AI开源工具 # 多模态模型 # 学术诚信 # 模型评测

LLMEval3

LLMEval3

LLMEval是由复旦大学NLP实验室推出的大模型评测基准，最新的LLMEval-3聚焦于专业知识能力评测，涵盖哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部划定的13个学科门类、50余个二级学科，共计约20W道标准生成式问答题目。

数据统计

相关导航

MMLU

大规模多任务语言理解基准

悟道

智源“悟道”大模型，中国首个+世界最大人工智能大模型

Visual Studio IntelliCode

Visual Studio AI辅助开发

Duo Chat

GitLab推出的AI编程助手

iFlyCode

科大讯飞推出的智能编程助手

Replicate

在线运行开源机器学习模型

雾象

免费开源的AI动画生成工具

JAX

Google推出的用于变换数值函数的机器学习框架

11 条评论

寒尸守夜读者

要是能自定义题库就好了，想重点测测工科这块。

5个月前中国浙江

回复