名鼎配资-炒股融资_在线炒股融资 期货配资鑫东财配资 首个AI高考全卷评测结果发布 数学成大模型短板
你的位置:名鼎配资-炒股融资_在线炒股融资 > 炒股融资 >

期货配资鑫东财配资 首个AI高考全卷评测结果发布 数学成大模型短板

发布日期:2024-08-23 10:05    点击次数:70

近期,上海人工智能实验室的官方微博分享了一则消息:司南评测体系OpenCompass启动了首次针对大模型的“语数外”高考全科目能力测评,使用的是全国新课标I卷作为测试基准。这次特别挑选了六个开源模型期货配资鑫东财配资,以及OpenAI的GPT-4o参与,所有开源模型的公开时间均早于高考日期,以保障测试环境的封闭性和公正性。评分工作则委托给具有实际高考阅卷经验的教师执行,确保评估结果贴近真实的阅卷标准。测试结果揭晓,阿里通义千问Qwen2-72B、OpenAI的GPT-4o以及书生·浦语2.0文曲星(InternLM2-20B-WQX)在众多模型中脱颖而出,分列前三名,它们的得分率分别是72.1%、70.5%和70.4%。从整体表现看,这些模型在语言类科目上展现了较强的能力,语文科目的平均得分率达到67%,英语更是高达81%。相比之下,数学成为多数模型的弱项期货配资鑫东财配资,平均得分率低至36%。其中,InternLM2-20B-WQX在数学上获得了最高分75分,尽管如此,这一成绩仍未能跨过及格线。



友情链接:

TOP