04
05
2025
评测显示,Claude-3仅列第四。其他模子得分正在55分附近较为集中,
由大学根本模子研究核心结合中关村尝试室研制的SuperBench大模子分析能力评测框架,领先第二名GLM-4 0.41分,文心一言4.0跨越GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。正在语义理解中的数学能力上,国内模子文心一言4.0表示亮眼,正在中文推理、中文言语等评测上遥遥领先,文心一言4.0取Claude-3并列全球第一;正在企业选择大模子最看沉的平安性评测上,而正在语义理解中的阅读理解能力上,力压国际一流模子GPT-4系列模子和Claude-3拿下最高分(89.1分),GPT-4系列模子位列第四五,评测共包含了14个具有代表性的模子!