AI发条
  • AI写作创作
    • AI内容创作
    • AI文档处理
    • AI排版工具
    • AI文案优化
    • AI创作辅助
    • AI写作工具
    • AI内容生成
    • AI字幕工具
  • AI办公提效
    • AI会议工具
    • AI办公协作
    • AI办公工具
    • AI协作平台
    • AI思维导图
    • AI文件管理
    • AI演示工具
    • AI表格工具
    • AI语音转录工具
  • AI图片图像
    • AI图像增强
    • AI修图软件
    • AI图像工具
    • AI图标工具
    • AI图像处理
    • AI矢量工具
    • AI调色工具
    • AI老照片修复
    • AI背景生成
    • AI背景移除工具
  • AI开发技术
    • AI代码检查
    • AI代码测试
    • AI开发工具
    • AI开发平台
    • AI代码生成
    • AI软件开发
    • AI开发框架
    • AI编程工具
    • AI开源工具
  • AI社交电商
    • AI变声工具
    • AI广告工具
    • AI口播工具
    • AI营销工具
    • AI电商工具
  • AI视频音频
    • AI视频工具
    • AI音频工具
    • AI视频音频
    • AI语音合成
    • AI语音工具
    • AI转录工具
    • AI语音理解
    • AI改变世界
    • AI写作创作
      • AI内容创作
      • AI文档处理
      • AI排版工具
      • AI文案优化
      • AI创作辅助
      • AI写作工具
      • AI内容生成
      • AI字幕工具
    • AI办公提效
      • AI会议工具
      • AI办公协作
      • AI办公工具
      • AI协作平台
      • AI思维导图
      • AI文件管理
      • AI演示工具
      • AI表格工具
      • AI语音转录工具
    • AI图片图像
      • AI图像增强
      • AI修图软件
      • AI图像工具
      • AI图标工具
      • AI图像处理
      • AI矢量工具
      • AI调色工具
      • AI老照片修复
      • AI背景生成
      • AI背景移除工具
    • AI开发技术
      • AI代码检查
      • AI代码测试
      • AI开发工具
      • AI开发平台
      • AI代码生成
      • AI软件开发
      • AI开发框架
      • AI编程工具
      • AI开源工具
    • AI社交电商
      • AI变声工具
      • AI广告工具
      • AI口播工具
      • AI营销工具
      • AI电商工具
    • AI视频音频
      • AI视频工具
      • AI音频工具
      • AI视频音频
      • AI语音合成
      • AI语音工具
      • AI转录工具
      • AI语音理解

    评测平台

    共 11 篇网址
    精选主流AI评测平台使用指南与对比分析,帮你选择最适合的工具提升模型开发效率。
    排序
    发布更新浏览点赞
    MMBench

    MMBench

    全方位的多模态大模型能力评测体系
    102,1700
    AI开发工具AI开发框架# 多模态模型# 模型评测# 评测平台
    MMLU

    MMLU

    大规模多任务语言理解基准
    195,7150
    AI开发工具AI开发技术# AI分析# 模型评测# 评测平台
    Open LLM Leaderboard

    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单
    163,6850
    AI开发工具AI开发框架# 开源工具# 模型评测# 评测平台
    H2O EvalGPT

    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统
    218,3840
    AI开发工具AI开发平台# 开源工具# 模型评测# 自动化工作流
    MagicArena

    MagicArena

    字节推出的视觉生成模型对战平台
    318,3650
    AI内容生成AI图像工具# AI分析# 多模态模型# 模型评测
    C-Eval

    C-Eval

    一个全面的中文基础模型评估套件
    4111,2150
    AI开发工具AI开发框架# AI分析# 模型评测# 评测平台
    OpenCompass

    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系
    12968,6270
    AI开发工具AI开发框架# 多模态模型# 开源工具# 模型评测
    LMArena

    LMArena

    AI模型评估平台
    4511,9270
    AI开发平台AI开源工具# 开源工具# 模型评测# 评测平台
    AGI-Eval

    AGI-Eval

    AI大模型评测社区
    195,9820
    AI开发平台AI开源工具# 数据众包# 模型评测# 评测平台
    睿信论文检测

    睿信论文检测

    中科睿鉴推出的一站式学术诚信检测系统
    3113,1610
    AI内容生成AI写作工具# AI分析# 学术诚信# 论文检测
    FlagEval

    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台
    4718,0440
    AI开发工具AI开发平台# AI分析# 多模态模型# 模型评测
    Copyright © 2026 AI发条 粤ICP备2023067720号 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件