HEML Holistic Evaluation of Language Models Holistic Evaluation of Language Models(HELM)是一个由斯坦福大学提出的语言模型综合评估框架。HELM对语言模型感兴趣的潜在应用场景(即用例)进行了广泛的分类。这些场景涵盖了多个任务、领域和语言,以确保评估的全面性。 1000 AI数据模型评测# HEML# 斯坦福大学# 语言模型整体评估
AskCodi免费ai编程 AskCodi是一款专为开发者设计的智能编码问答助手,旨在通过自然语言交互为开发者提供实时的编码帮助和解决方案。它集成了先进的自然语言处理技术和深度学习算法,能够准确理解开发者的需求,并提供高效、准确的代码建议和解决方案。 980 AI编程# AskCodi
CMMLU CMMLU(Chinese Multi-task Language Understanding)是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从小学到大学或专业水平的67个主题,包括自然科学(如物理、化学)、人文科学(如历史、哲学)、社会科学(如经济学、政治学)等领域。 970 AI数据模型评测# Chinese Multi-task Language Understanding# CMMLU# 中文评估基准
FlagEval FlagEval是北京智源人工智能研究院推出的一个大模型评测体系及开放平台,FlagEval覆盖自然语言处理(NLP)、计算机视觉(CV)、语音(Audio)和多模态(Multimodal)四大领域,提供多维度评测。 960 AI数据模型评测# FlagEval# 大模型评测体系
Apache MXNet Apache MXNet 是一个灵活且可扩展的开源深度学习框架,MXNet 深度集成到 Python 中,并支持 Scala、Julia、Clojure、Java、C++、R 和 Perl 等多种编程语言。 920 AI开发平台# Apache MXNet# Apache Spark