ai-tab

帅气的我简直无法用语言描述!
C-Eval

C-Eval

C-EVAL由上海交通大学、清华大学与爱丁堡大学联合研发,是首个专注于中文大语言模型(LLM)的综合性评测套件
02440
Open LLM Leaderboard

Open LLM Leaderboard

Open LLM Leaderboard 由全球最大的AI开源社区Hugging Face于2023年推出,旨在解决大模型性能评估的“信息迷雾”
04930
MMLU

MMLU

MMLU(大规模多任务语言理解)由斯坦福大学研究团队开发,是评估大型语言模型(如GPT、Claude系列)综合能力的黄金标准。
03610
AGI-Eval

AGI-Eval

微软研究院于2023年推出,是首个以人类标准化考试(如中国高考、美国SAT、法学院入学考试LSAT等)为基准的大模型评估系统
03170
Evidently AI

Evidently AI

基于 Python 的开源库,专注于机器学习和大型语言模型(LLM)的评估与监控
03700
Replicate

Replicate

通过统一接口支持文本、图像、语音、视频等多种模态的AI模型部署,覆盖从实验到生产落地的全生命周期
05240
Scale AI

Scale AI

数据标注、模型训练、合成数据生成的全链条AI基建平台
07870
Lobe

Lobe

专注提升人机交互体验的开源AI框架
02660
Watsonx.ai

Watsonx.ai

聚焦于帮助企业快速构建、部署和管理生成式AI与机器学习模型,尤其强调数据可信度与合规性
01670
StableVicuna

StableVicuna

首个融合指令微调(Instruction Tuning)与强化学习人类反馈(RLHF)的开源聊天机器人,它突破了传统模型仅依赖单一训练范式的局限,显著提升了对话质量和任务泛化能力
01070
Imagen

Imagen

谷歌Imagen是由Google DeepMind团队开发的AI图像生成工具,基于先进的扩散模型和多模态技术,能够根据文本描述生成高分辨率、细节丰富的图像
02420
天壤小白

天壤小白

基于大语言模型的AI应用开放平台
01970