华为开源7B参数openPangu-Embedded-7B-v1.1华为开源openPangu-Embedded-7B-v1.1模型,首创快慢思考双模式自由切换技术。通过渐进式微调和自适应机制,在保持精度的同时将思维链缩短近50%,显著提升推理效率,支持边缘部署与复杂...AI项目和框架# ai模型# 华为# 大语言模型1个月前
Qwen3-ASR-Flash – 阿里通义录音文件识别模型阿里通义千问Qwen3-ASR-Flash是一款高精度语音识别模型,支持11种语言及多种方言口音。其创新上下文引导机制可定制识别结果,提升专业术语准确率。在复杂噪声环境、歌声转写(错误率低于8%)及多...AI项目和框架# ai模型# 语音文件识别# 语音模型1个月前
Seedream 4.0 – 字节跳动多模态4K图像生成模型|免费AI创作工具Seedream 4.0是字节跳动推出的新一代多模态图像模型,支持4K高清生成与编辑,融合文本+图像输入,实现多图融合、风格迁移、精准修图,10倍提速,适用于电商、设计、影视创作。AI项目和框架# AI图像框架# ai模型# 字节跳动1个月前
Ovis2.5 – 原生分辨率视觉模型阿里国际最近放出了新一代多模态大模型 Ovis2.5,一口气带来 9B(90 亿参数)和 2B(20 亿参数)两个版本 —— 这俩可不简单,直接把开源模型的性能纪录给刷新了。更值得关注的是它的三大升级...AI项目和框架# ai模型# ai视觉模型# 阿里巴巴2个月前
MiniCPM-V 4.5 : 3D-Resampler加持,高刷新率视频理解能力面壁智能开源8B参数多模态模型MiniCPM-V4.5,首次支持高刷视频理解(10fps),性能超越72B级大模型。核心技术3D-Resampler实现96倍视觉压缩,兼顾OCR、文档解析全场景SOT...AI快讯# ai多模态模型# ai模型2个月前
字节豆包研发“3D Model Generator”3D模型生成工具,或近期开放。字节旗下豆包正内测3D模型生成工具“3D Model Generator”,支持单图生成、图模结合两种模式,30秒输出游戏级3D资产,面数超100万、细节保留95%+,或将重塑游戏开发与3D内容生产流...AI快讯# ai图像模型# ai模型# 字节跳动2个月前
Gemini 2.5 Flash图像模型 – 实时视觉处理引擎开发者在图像生成中难以保持风格一致或做精准编辑?Gemini 2.5 Flash Image 实测可通过自然语言完成多图融合和局部转换,生成一张图成本仅约 $0.039,马上体验融合与编辑的新路径。AI项目和框架# ai图像模型# ai模型# Gemini2个月前
X-PLUG推出Mobile-Agent-v3跨平台多代理框架,增强跨平台自动化体验。针对跨平台自动化效率低问题,Mobile-Agent-v3 实测速度提升60%,支持一键调用多代理任务,免费开源工具。AI项目和框架# ai模型# 阿里巴巴2个月前
群核科技开源3D场景生成模型SpatialGen,一句话生成可交互的3D室内设计。群核科技开源SpatialGen-1.0模型,支持图像/文本生成多模态3D室内场景,提供48房间测试集与4.8K渲染图像,革新设计工作流。AI项目和框架# ai模型2个月前
DeepSeek-V3:高效MoE架构突破,128K上下文开源模型新标杆针对大模型训练成本高的问题,DeepSeek-V3实测训练成本仅278.8万GPU小时,性能超越LLaMA3-405B,支持128K长文本处理,开源社区可即刻部署。AI项目和框架# ai模型# DeepSeek2个月前