MMLU Dataset(大规模多任务语言理解数据集) MMLU Dataset旨在通过仅在零样本和少样本设置中评估模型来衡量预训练期间获得的知识。这使得基准测试更具挑战性,并且更类似于人类评估知识的方式。该基准涵盖了STEM(科学、技术、工程和数学)、人文、社会科学等领域的57个学科,难度从初级到高级专业水平不等,既考验世界知识,也考验解决问题的能力。
索邦大学 索邦大学(Sorbonne University / Université Sorbonne) 是法国最负盛名的公立研究型大学之一,拥有深厚的人文传统和强大的理工实力。作为巴黎大学传统的核心继承者,索邦大学在文学、哲学、历史、语言学、数学、物理、计算机、生物医学、海洋科学等领域世界领先,是“拉丁学术传统与现代科学融合”的代表高校。
奥胡斯大学 奥胡斯大学(Aarhus University,简称 AU) 是丹麦规模第二、科研实力顶尖的国立研究型大学,在生物医药、农业与食品科学、环境科学、经济与管理、教育学、社会学、语言学、政治学、考古学等领域处于北欧一流水平。它是北欧“ARCTIC五校联盟”成员,以跨学科、国际化、可持续发展导向著称。