MMLU Dataset(大规模多任务语言理解数据集)

MMLU Dataset(大规模多任务语言理解数据集)

MMLU Dataset旨在通过仅在零样本和少样本设置中评估模型来衡量预训练期间获得的知识。这使得基准测试更具挑战性,并且更类似于人类评估知识的方式。该基准涵盖了STEM(科学、技术、工程和数学)、人文、社会科学等领域的57个学科,难度从初级到高级专业水平不等,既考验世界知识,也考验解决问题的能力。
600
三联书店

三联书店

三联书店以出版高品位的人文科学专业图书和社会科学的译著图书为主,出版物涉及哲学、历史、文学、艺术、经济、政治、法律和社会生活等多个领域。三联书店还出版了多种有影响力的杂志,如《读书》、《三联生活周刊》、《爱乐》和《竞争力》等。其中,《读书》杂志自1979年创办以来,一直是中国知识分子十分钟爱的一本杂志。
510