ai-tab

帅气的我简直无法用语言描述！

文章892 网址982 书籍0 软件5 评论1

C-Eval

C-EVAL由上海交通大学、清华大学与爱丁堡大学联合研发，是首个专注于中文大语言模型（LLM）的综合性评测套件

02440

AI模型评测 # AI模型评测

Open LLM Leaderboard

Open LLM Leaderboard

Open LLM Leaderboard 由全球最大的AI开源社区Hugging Face于2023年推出，旨在解决大模型性能评估的“信息迷雾”

04930

AI模型评测 # AI模型评测

MMLU

MMLU（大规模多任务语言理解）由斯坦福大学研究团队开发，是评估大型语言模型（如GPT、Claude系列）综合能力的黄金标准。

03610

AI模型评测 # AI模型评测

AGI-Eval

微软研究院于2023年推出，是首个以人类标准化考试（如中国高考、美国SAT、法学院入学考试LSAT等）为基准的大模型评估系统

03170

AI模型评测 # AI模型评测

Evidently AI

基于 Python 的开源库，专注于机器学习和大型语言模型（LLM）的评估与监控

03700

AI训练模型 # AI训练模型

Replicate

通过统一接口支持文本、图像、语音、视频等多种模态的AI模型部署，覆盖从实验到生产落地的全生命周期

05240

AI训练模型 # AI训练模型

Scale AI

数据标注、模型训练、合成数据生成的全链条AI基建平台

07870

AI训练模型 # AI训练模型

Lobe

专注提升人机交互体验的开源AI框架

02660

AI训练模型 # AI训练模型

Watsonx.ai

聚焦于帮助企业快速构建、部署和管理生成式AI与机器学习模型，尤其强调数据可信度与合规性

01670

AI训练模型 # AI训练模型

StableVicuna

首个融合指令微调（Instruction Tuning）与强化学习人类反馈（RLHF）的开源聊天机器人，它突破了传统模型仅依赖单一训练范式的局限，显著提升了对话质量和任务泛化能力

01070

AI训练模型 # AI训练模型

Imagen

谷歌Imagen是由Google DeepMind团队开发的AI图像生成工具，基于先进的扩散模型和多模态技术，能够根据文本描述生成高分辨率、细节丰富的图像

02420

AI训练模型 # AI训练模型

天壤小白

基于大语言模型的AI应用开放平台

01970

AI训练模型 # AI训练模型