ai模型

共 10 篇文章

排序

华为开源openPangu-Embedded-7B-v1.1模型，首创快慢思考双模式自由切换技术。通过渐进式微调和自适应机制，在保持精度的同时将思维链缩短近50%，显著提升推理效率，支持边缘部署与复杂...

10个月前

阿里通义千问Qwen3-ASR-Flash是一款高精度语音识别模型，支持11种语言及多种方言口音。其创新上下文引导机制可定制识别结果，提升专业术语准确率。在复杂噪声环境、歌声转写（错误率低于8%）及多...

10个月前

Seedream 4.0是字节跳动推出的新一代多模态图像模型，支持4K高清生成与编辑，融合文本+图像输入，实现多图融合、风格迁移、精准修图，10倍提速，适用于电商、设计、影视创作。

10个月前

阿里国际最近放出了新一代多模态大模型 Ovis2.5，一口气带来 9B（90 亿参数）和 2B（20 亿参数）两个版本 —— 这俩可不简单，直接把开源模型的性能纪录给刷新了。更值得关注的是它的三大升级...

11个月前

面壁智能开源8B参数多模态模型MiniCPM-V4.5，首次支持高刷视频理解（10fps），性能超越72B级大模型。核心技术3D-Resampler实现96倍视觉压缩，兼顾OCR、文档解析全场景SOT...

11个月前

字节旗下豆包正内测3D模型生成工具“3D Model Generator”，支持单图生成、图模结合两种模式，30秒输出游戏级3D资产，面数超100万、细节保留95%+，或将重塑游戏开发与3D内容生产流...

11个月前

开发者在图像生成中难以保持风格一致或做精准编辑？Gemini 2.5 Flash Image 实测可通过自然语言完成多图融合和局部转换，生成一张图成本仅约 $0.039，马上体验融合与编辑的新路径。

11个月前

针对跨平台自动化效率低问题，Mobile-Agent-v3 实测速度提升60%，支持一键调用多代理任务，免费开源工具。

11个月前

群核科技开源SpatialGen-1.0模型，支持图像/文本生成多模态3D室内场景，提供48房间测试集与4.8K渲染图像，革新设计工作流。

11个月前

针对大模型训练成本高的问题，DeepSeek-V3实测训练成本仅278.8万GPU小时，性能超越LLaMA3-405B，支持128K长文本处理，开源社区可即刻部署。

11个月前