自2023年以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。进入2024年,全球大模型竞争态势日益加剧,随着GPT-4o、Claude3.5、Gemini1.5-pro和Llama3的发布,国内大模型同样在2024年上半年内进行了波澜壮阔的大模型追逐赛。中文大模型测评基准SuperCLUE持续对国内外大模型的发展趋势和综合效果进行了实时跟踪。基于此,我们发布了《中文大模型基准测评2024上半年报告》,在AI大模型发展的巨大浪潮中,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。 国内大模型关键进展及趋势: 2023-2024年大模型关键进展 2024年值得关注的中文大模型全景图 2023-2024年度国内外大模型技术发展趋势
SuperCLUE通用能力测评: 中文大模型基准SuperCLUE介绍 SuperCLUE测评体系及数据集 总榜、理科榜单、文科榜单、Hard榜单及模型象限 开源榜单及端侧小模型榜单 大模型对战胜率、成熟度指数 评测与人类一致性分析
SuperCLUE多模态能力测评: AIGVBench视频生成测评 SuperCLUE-Image文生图测评 SuperCLUE-V多模态理解测评