ai-tab

帅气的我简直无法用语言描述!
Coursera

Coursera

斯坦福大学计算机教授Daphne Koller和吴恩达(Andrew Ng)联合创立,初衷是让全球用户都能接触顶尖教育资源。
05200
fast.ai

fast.ai

AI教育家Jeremy Howard与Rachel Thomas联合创立,是一个基于PyTorch的开源深度学习框架。
03500
Day of AI

Day of AI

麻省理工学院RAISE实验室于2021年推出,是全球首个面向K-12阶段(幼儿园至高中)的免费人工智能教育项目。
04890
PubMedQA

PubMedQA

MIT授权开源的一款生物医学问答数据集与工具集,专为处理复杂科研文献设计
04670
LLMEval3

LLMEval3

大语言模型的全生命周期评测与优化
01720
Chatbot Arena

Chatbot Arena

全球最权威的开源大模型评测平台
06640
HELM

HELM

斯坦福大学基础模型研究中心(CRFM)于2022年发布,是首个覆盖语言模型能力、风险与效率的系统性评测框架。
05110
MMBench

MMBench

OpenCompass团队推出的开源评测基准,旨在解决传统AI模型评估中存在的“能力盲区”问题
04750
CMMLU

CMMLU

CMMLU由上海交通大学、微软亚洲研究院与墨尔本大学联合推出,是一个专注于中文语言和文化背景的大模型评测工具。
01800
OpenCompass

OpenCompass

OpenCompass由上海人工智能实验室于2023年8月正式开源,定位为大模型评测的全链路工具平台。
04220
SuperCLUE

SuperCLUE

SuperCLUE由CLUE中文语言理解测评基准发展而来(2019年发起),是专注于中文通用大模型评估的独立第三方机构。
05540
FlagEval

FlagEval

FlagEval由北京智源人工智能研究院于2023年推出,是首个覆盖"能力-任务-指标"三维评估体系的智能评测平台。
02710