苹果提AI训练新方法RLCF,用任务清单替代人工评分,提升模型复杂指令能力。苹果提出RLCF强化学习框架,用AI生成任务清单替代人工评分,解决大模型执行多步骤指令的瓶颈。在五大基准测试中全面突破,复杂任务性能最高提升8.2%,重塑高效模型训练路径。AI快讯# 苹果AI14小时前