多模态革命|阿里Qwen2.5-Omni-7B破局:全模态实时交互的开源突围2025年3月,阿里云以Qwen2.5-Omni-7B模型引爆多模态AI战场。这款仅7B参数的端到端全模态模型,凭借Thinker-Talker双核架构与TMRoPE时间对齐技术,实现文本/图像/音视...AI项目和框架11个月前
群核科技开源3D场景生成模型SpatialGen,一句话生成可交互的3D室内设计。群核科技开源SpatialGen-1.0模型,支持图像/文本生成多模态3D室内场景,提供48房间测试集与4.8K渲染图像,革新设计工作流。AI项目和框架# ai模型7个月前
Scale AI推出SEAL模型评估工具:重塑大模型评测新标杆Scale AI最新发布的**SEAL大模型评估工具**,通过私有数据集+专家评审双重机制,彻底解决传统评测中模型过拟合问题。本文详解其**适用人群、5大核心功能技术原理、实操技巧及官方访问入口...AI项目和框架9个月前
华为开源7B参数openPangu-Embedded-7B-v1.1华为开源openPangu-Embedded-7B-v1.1模型,首创快慢思考双模式自由切换技术。通过渐进式微调和自适应机制,在保持精度的同时将思维链缩短近50%,显著提升推理效率,支持边缘部署与复杂...AI项目和框架# ai模型# 华为# 大语言模型6个月前
Neuralink×OpenAI脑机接口:65字/分钟意念打字技术解析 | 医疗AI革命本文解析Neuralink与OpenAI联合开发的脑机文本生成系统如何实现**65字/分钟**的意念输入速度(达自然语速70%),揭秘1024电极阵列与AI算法的协同革命,并探讨其在医疗、人机交互领域...AI项目和框架9个月前
NIST强制新规:联邦AI系统需通过87项攻击测试|2025合规指南NIST发布AI安全新标准,要求联邦采购AI系统通过对抗性鲁棒测试。详解87项攻击场景防护方案、供应链安全加固技巧及红队测试工具,助企业快速达标。AI项目和框架9个月前
微软发布Orca-3 13B:突破性数学推理与低显存需求,消费级显卡可部署微软最新发布了Orca-3 13B,一个基于“认知蒸馏”训练框架的突破性AI模型。它在MATH基准上的数学推理得分首次超越GPT-4(89.2%对88.7%),同时将推理所需显存大幅降低了75%,让普...AI项目和框架9个月前
DeepSeek-V3:高效MoE架构突破,128K上下文开源模型新标杆针对大模型训练成本高的问题,DeepSeek-V3实测训练成本仅278.8万GPU小时,性能超越LLaMA3-405B,支持128K长文本处理,开源社区可即刻部署。AI项目和框架# ai模型# DeepSeek7个月前
AI代码革命|DeepSeek V3-0324 MoE架构重构,MIT协议引爆开发者生态2025年3月24日,DeepSeek发布V3-0324模型,以6850亿参数的MoE架构(混合专家模型)实现代码生成与数学推理的跃迁式升级。在Claude 3.7 Sonnet与GPT-4.5的竞争...AI项目和框架11个月前
微软开源 VibeVoice-1.5B 音频模型,实现语音合成重大突破传统语音合成面临长对话断裂、角色一致性差等痛点。微软VibeVoice通过7.5Hz超低帧率分词器实现3200倍音频压缩,在实测中合成90分钟多角色对话的MOS评分达3.76分。开源框架支持中英双语播...AI项目和框架# AI音频模型7个月前