格隆汇3月4日|据豆包大模型团队官微,近日,豆包大模型团队开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。据介绍,该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。
豆包大模型团队开源基准测试集SuperGPQA
未经允许不得转载:
街坊秀 »
豆包大模型团队开源基准测试集SuperGPQA
格隆汇3月4日|据豆包大模型团队官微,近日,豆包大模型团队开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。据介绍,该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。
“IP for her”:揭秘知识产权如何点燃“她经济”
2025-03-08 12:45:24阅读(62)
对话诺奖得主约瑟夫·斯蒂格利茨丨人工智能信息生态与经济格局
2025-03-14 17:40:42阅读(58)
第九届CCER夏季研讨会征文启事
2025-03-11 21:17:21阅读(56)
鞍钢走出来的四位现任副部级干部:一位副主任、一位副省长、两位央企董事长
2025-03-04 00:25:27阅读(56)
EconoScope丨China's private economy ushers in greater opportunities for growth
2025-03-12 20:10:23阅读(55)