
MMLU Dataset(大规模多任务语言理解数据集)
MMLU Dataset旨在通过仅在零样本和少样本设置中评估模型来衡量预训练期间获得的知识。这使得基准测试更具挑战性,并且更类似于人类评估知识的方式。该基准涵盖了STEM(科学、技术、工程和数学)、人文、社会科学等领域的57个学科,难度从初级到高级专业水平不等,既考验世界知识,也考验解决问题的能力。
牛津大学(University of Oxford)是英国乃至世界顶尖的学府之一,以下是对牛津大学的详细介绍:
本科申请:
研究生申请:







