HEML Holistic Evaluation of Language Models Holistic Evaluation of Language Models(HELM)是一个由斯坦福大学提出的语言模型综合评估框架。HELM对语言模型感兴趣的潜在应用场景(即用例)进行了广泛的分类。这些场景涵盖了多个任务、领域和语言,以确保评估的全面性。 940 AI数据模型评测# HEML# 斯坦福大学# 语言模型整体评估
SuperCLUE SuperCLUE是中文通用大模型综合性评测基准,由CLUE团队推出,是中文语言理解测评基准(CLUE)在通用人工智能时代的进一步发展。SuperCLUE通过多层次、多维度的测评基准,覆盖语言理解与生成、知识理解与应用、专业能力、环境适应与安全性等多个方面。 1050 AI数据模型评测# SuperCLUE# 中文通用大模型综合性评测
Chatbot Arena Chatbot Arena 由非营利组织 LMSYS Org 开发,该组织由多家高校和研究机构合作成立,旨在推动大型模型技术的普及和应用。Chatbot Arena 是一个大模型评测排行榜和竞技场,旨在通过众包和用户投票的方式,评估大型语言模型(LLMs)在实际对话任务中的性能。 920 AI数据模型评测# Chatbot Arena
AGI Eval评测社区 AGI-Eval评测社区是一个由上海交通大学、同济大学、华东师范大学及DataWhale等知名高校与机构联合打造的大模型评测平台。基于统一的评测标准,AGI-Eval提供业内大语言模型的全面能力得分排名,涵盖综合评测及各专项能力评测,数据透明、权威。 910 AI数据模型评测# AGI-Eval评测社区# AGIEval
LLMeval/llmeval-3 LLMEval3 是由复旦大学自然语言处理(NLP)实验室推出的大模型评测基准。LLMEval3 涵盖了教育部划定的 13 个学科门类,包括哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学和艺术学。这些学科门类下进一步细分为 50 余个二级学科,确保评测的全面性和深度。 1000 AI数据模型评测# LLMeval# llmeval-3
H2oGPT H2oGPT 是一个功能强大、灵活易用的开源项目,为用户提供了全新的文档处理和对话体验。H2oGPT 基于 Apache V2 许可,是一个完全开源的项目。这意味着用户可以免费使用、修改和分发代码,同时促进社区合作和贡献。 1030 AI数据模型评测# H2O EVAL GPT# H2oGPT# H2O评估工作室
PubMedQA PubMedQA 是一个专门设计用于支持开发和评估能够在生物医学文献中找到答案的问答系统的高质量数据集。它由PubMed文献库中的数据构建而成,这些文献库是全球最大的生物医学文献数据库之一。 1210 AI数据模型评测常用推荐# PubMedQA# 文献库# 生物医学文献
MMLU Dataset(大规模多任务语言理解数据集) MMLU Dataset旨在通过仅在零样本和少样本设置中评估模型来衡量预训练期间获得的知识。这使得基准测试更具挑战性,并且更类似于人类评估知识的方式。该基准涵盖了STEM(科学、技术、工程和数学)、人文、社会科学等领域的57个学科,难度从初级到高级专业水平不等,既考验世界知识,也考验解决问题的能力。 1250 AI数据模型评测常用推荐# MMLU Dataset# 大规模多任务语言理解数据集
Trancy Trancy是一个专为语言学习者设计的全能工具,提供了沉浸式AI语言学习的各种功能。支持YouTube、Netflix等平台的双语字幕,帮助用户在观看视频时学习语言。除了YouTube和Netflix,还支持HBO Max、TED、edX、Coursera等平台。 1050 AI学习教育# AI语言学习# Trancy# 语言学习
神经网络入门 从神经网络的基本概念开始,逐步深入。包括计算机视觉问题、编程的局限性、计算机学习能力、人工神经元(如决策框、激活算术等)、神经网络的结构(构建 XOR 门、隐藏层等)、应用(分类、曲线拟合、形状识别)以及理论基础(通用近似器)等。 1100 AI学习教育# Brilliant# 神经网络入门
Kaggle Kaggle 是一个在线数据科学和机器学习竞赛平台,Kaggle 致力于为数据科学家、机器学习工程师、统计学家和数据分析师等提供展示技能、交流学习的舞台 1090 AI学习教育# Kaggle# 在线数据科学# 机器学习竞赛
Machine Learning for Beginners Machine Learning for Beginners(机器学习入门)是由微软云倡导者团队推出的一门面向初学者的机器学习课程。该课程专为初学者设计,旨在帮助没有机器学习背景的学员快速掌握机器学习的基础知识和实践技能。 1020 AI学习教育# Machine Learning for Beginners# ML for Beginners
Generative AI for Beginners Generative AI for Beginners 是由微软云倡导者团队推出的生成式人工智能(Generative AI)入门课程,涵盖生成式AI的基础知识、模型选择、提示工程、应用开发等,从理论学习到实践操作,全方位指导学习者构建生成式AI应用。 1130 AI学习教育# Generative AI# Generative AI for Beginners# 生成式人工智能
Machine learning mastery Machine Learning Mastery是一个专注于机器学习领域的在线教育资源平台,Machine Learning Mastery提供了从入门到高级的机器学习知识和工具,内容涵盖机器学习基础、神经网络、深度学习、计算机视觉、自然语言处理等机器学习中最重要的分支与技术。 1090 AI学习教育# machine learning mastery# 在线教育资源平台# 机器学习平台