蚂蚁数科发布金融推理大模型Agentar-Fin-R1，性能全面领先行业

132 0

一、产品介绍

蚂蚁数科（蚂蚁集团旗下独立科技公司）于2025年世界人工智能大会推出新一代金融推理大模型 Agentar-Fin-R1。该模型基于阿里巴巴Qwen3技术框架研发，主打“可靠、可控、可优化”三大特性，专为金融场景设计。在Fineval1.0、FinanceIQ等权威评测中，其金融专业性、推理能力及安全合规性均超越DeepSeek-R1等同级开源模型。

产品定位：为银行、证券、保险等机构提供智能中枢，推动“对话即服务”等新型金融交互模式落地，解决通用大模型与金融业务间的“知识鸿沟”问题。

二、适用人群

✅ 金融机构决策层：需提升AI竞争力与用户粘性的银行、保险、资管公司高管
✅ 金融科技研发团队：寻求高效部署专业级大模型的技术负责人
✅ 金融产品经理：设计智能投顾、自动化风控、AI客服等场景的解决方案专家
✅ 监管科技机构：需平衡创新与合规的金融科技评测单位

三、核心功能与技术解析

Agentar-Fin-R1通过千亿级金融语料训练与算法创新实现能力突破，核心功能优先级如下：

功能模块	技术实现原理	业务价值
金融复杂推理引擎	基于专家标注的金融长思维链（CoT）构造机制，支持多步骤逻辑推理与数值计算	处理信贷评估、衍生品定价等高复杂度任务准确率提升35%
动态知识更新系统	实时吸收金融政策/市场数据，通过主动学习机制动态优化模型权重	减少二次微调数据需求50%，降低落地成本
安全合规防护体系	内嵌监管规则知识库 + 敏感信息过滤层，通过Finova评测认证	满足金融级数据隐私与合规要求（如GDPR、中国金融安全规范）
多任务并发处理	采用MOE（Mixture of Experts）架构，支持银行、证券等6大类场景66小类任务并行响应	单次响应效率提升40%，支持高并发业务场景
自然语言交互优化	融合意图识别与结构化输出技术，实现“对话即服务”	用户指令理解准确率达92%，老年用户满意度提升30%

四、工具使用技巧

版本选择策略
- 高实时场景（如交易咨询）：选用8B参数版 + MOE架构，响应速度优先
- 深度分析场景（如风险评估）：部署32B参数版，强化推理深度
领域微调捷径
利用蚂蚁开源的 Agentar-Deepfinance-100K 数据集（覆盖信托、基金等长尾场景），仅需补充10%机构自有数据即可完成业务适配
合规性兜底方案
启用内置的监管规则插件，自动拦截敏感操作（如超权限数据访问），并通过Finova评测工具定期自查

? 案例速递：上海某银行接入8B参数版后，通过“自然对话→自动生成理财报告”流程，月活用户增长25%，人工坐席成本降低18%

五、访问地址与资源

官方模型入口：蚂蚁数科金融智能体平台Agentar（信通院评级5级）
开源数据集：
- Finova评测基准（GitHub搜索“Finova-Benchmark”）
- Agentar-Deepfinance-100K训练数据集
行业方案库：覆盖智能投顾、反欺诈、监管报送等100+场景