ai-tab

帅气的我简直无法用语言描述！

文章892 网址982 书籍0 软件5 评论1

Coursera

斯坦福大学计算机教授Daphne Koller和吴恩达（Andrew Ng）联合创立，初衷是让全球用户都能接触顶尖教育资源。

05200

AI学习网站 # AI学习网站

fast.ai

AI教育家Jeremy Howard与Rachel Thomas联合创立，是一个基于PyTorch的开源深度学习框架。

03500

AI学习网站 # AI学习网站

Day of AI

麻省理工学院RAISE实验室于2021年推出，是全球首个面向K-12阶段（幼儿园至高中）的免费人工智能教育项目。

04890

AI学习网站 # AI学习网站

PubMedQA

MIT授权开源的一款生物医学问答数据集与工具集，专为处理复杂科研文献设计

04670

AI模型评测 # AI模型评测

LLMEval3

大语言模型的全生命周期评测与优化

01720

AI模型评测 # AI模型评测

Chatbot Arena

全球最权威的开源大模型评测平台

06640

AI模型评测 # AI模型评测

HELM

斯坦福大学基础模型研究中心（CRFM）于2022年发布，是首个覆盖语言模型能力、风险与效率的系统性评测框架。

05110

AI模型评测 # AI模型评测

MMBench

OpenCompass团队推出的开源评测基准，旨在解决传统AI模型评估中存在的“能力盲区”问题

04750

AI模型评测 # AI模型评测

CMMLU

CMMLU由上海交通大学、微软亚洲研究院与墨尔本大学联合推出，是一个专注于中文语言和文化背景的大模型评测工具。

01800

AI模型评测 # AI模型评测

OpenCompass

OpenCompass由上海人工智能实验室于2023年8月正式开源，定位为大模型评测的全链路工具平台。

04220

AI模型评测 # AI模型评测

SuperCLUE

SuperCLUE由CLUE中文语言理解测评基准发展而来（2019年发起），是专注于中文通用大模型评估的独立第三方机构。

05540

AI模型评测 # AI模型评测

FlagEval

FlagEval由北京智源人工智能研究院于2023年推出，是首个覆盖"能力-任务-指标"三维评估体系的智能评测平台。

02710

AI模型评测 # AI模型评测