AI大全

共 968 篇网址

HEML Holistic Evaluation of Language Models

HEML Holistic Evaluation of Language Models

Holistic Evaluation of Language Models（HELM）是一个由斯坦福大学提出的语言模型综合评估框架。HELM对语言模型感兴趣的潜在应用场景（即用例）进行了广泛的分类。这些场景涵盖了多个任务、领域和语言，以确保评估的全面性。

1000

AI数据模型评测 # HEML # 斯坦福大学 # 语言模型整体评估

AskCodi免费ai编程

AskCodi是一款专为开发者设计的智能编码问答助手，旨在通过自然语言交互为开发者提供实时的编码帮助和解决方案。它集成了先进的自然语言处理技术和深度学习算法，能够准确理解开发者的需求，并提供高效、准确的代码建议和解决方案。

980

AI编程 # AskCodi

CMMLU

CMMLU（Chinese Multi-task Language Understanding）是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从小学到大学或专业水平的67个主题，包括自然科学（如物理、化学）、人文科学（如历史、哲学）、社会科学（如经济学、政治学）等领域。

970

AI数据模型评测 # Chinese Multi-task Language Understanding # CMMLU # 中文评估基准

FlagEval

FlagEval是北京智源人工智能研究院推出的一个大模型评测体系及开放平台,FlagEval覆盖自然语言处理（NLP）、计算机视觉（CV）、语音（Audio）和多模态（Multimodal）四大领域，提供多维度评测。

960

AI数据模型评测 # FlagEval # 大模型评测体系

Apache MXNet

Apache MXNet 是一个灵活且可扩展的开源深度学习框架，MXNet 深度集成到 Python 中，并支持 Scala、Julia、Clojure、Java、C++、R 和 Perl 等多种编程语言。

920

AI开发平台 # Apache MXNet # Apache Spark