ai-tab

帅气的我简直无法用语言描述!
Ovis2.5 – 原生分辨率视觉模型

Ovis2.5 – 原生分辨率视觉模型

阿里国际最近放出了新一代多模态大模型 Ovis2.5,一口气带来 9B(90 亿参数)和 2B(20 亿参数)两个版本 —— 这俩可不简单,直接把开源模型的性能纪录给刷新了。更值得关注的是它的三大升级...
3个月前
谷歌 Nano Banana 火了!重构 AI 修图逻辑,Veo 3 限时免费狂掀创作热潮

谷歌 Nano Banana 火了!重构 AI 修图逻辑,Veo 3 限时免费狂掀创作热潮

Nano Banana凭借人物一致性、多步编辑能力颠覆传统修图流程,成为LMArena盲测榜首;谷歌同期开放Veo 3限免体验,支持8秒带音效视频生成。本文深度解析技术突破与实战技巧。
3个月前
Jet-Nemotron:PostNAS与JetBlock创新

Jet-Nemotron:PostNAS与JetBlock创新

在长上下文语言模型的开发中,开发者常被 “计算效率低” 与 “精度难突破” 两大问题困住 —— 而 NVIDIA 最新推出的 Jet-Nemotron 语言模型,恰好为这一痛点提供了突破性方案。它不仅...
3个月前
豆包新推未成年人保护模式:锁住娱乐干扰,把AI变成孩子的学习好帮手

豆包新推未成年人保护模式:锁住娱乐干扰,把AI变成孩子的学习好帮手

2025年8月26日,字节跳动旗下的豆包App悄悄上线了一项特别功能——未成年人保护模式。靠密码锁定就能管住视频推荐、第三方网页浏览这些容易分心的功能,连非官方智能体的对话也会受限,只留下翻译、资料查...
3个月前
MiniCPM-V 4.5 : 3D-Resampler加持,高刷新率视频理解能力

MiniCPM-V 4.5 : 3D-Resampler加持,高刷新率视频理解能力

面壁智能开源8B参数多模态模型MiniCPM-V4.5,首次支持高刷视频理解(10fps),性能超越72B级大模型。核心技术3D-Resampler实现96倍视觉压缩,兼顾OCR、文档解析全场景SOT...
3个月前
字节豆包研发“3D Model Generator”3D模型生成工具,或近期开放。

字节豆包研发“3D Model Generator”3D模型生成工具,或近期开放。

字节旗下豆包正内测3D模型生成工具“3D Model Generator”,支持单图生成、图模结合两种模式,30秒输出游戏级3D资产,面数超100万、细节保留95%+,或将重塑游戏开发与3D内容生产流...
3个月前
微软WinUI – Windows应用开发框架

微软WinUI – Windows应用开发框架

开发者对 WinUI 控件了解成本高?WinUI-Gallery 实测可提升 UI 探索效率 3 倍,提供全控件互动演示与实时代码示例。
3个月前
苹果提AI训练新方法RLCF,用任务清单替代人工评分,提升模型复杂指令能力。

苹果提AI训练新方法RLCF,用任务清单替代人工评分,提升模型复杂指令能力。

苹果提出RLCF强化学习框架,用AI生成任务清单替代人工评分,解决大模型执行多步骤指令的瓶颈。在五大基准测试中全面突破,复杂任务性能最高提升8.2%,重塑高效模型训练路径。
3个月前
Perplexity AI设出版商分成AI搜索收入计划,4250万美元助其解决版权问题。

Perplexity AI设出版商分成AI搜索收入计划,4250万美元助其解决版权问题。

Perplexity AI宣布推出全球首个AI搜索收入分成计划,设立4250万美元专项基金,将订阅收入的80%分给内容出版商,以解决版权争议并构建可持续的内容生态。
3个月前
Gemini 2.5 Flash图像模型 – 实时视觉处理引擎

Gemini 2.5 Flash图像模型 – 实时视觉处理引擎

开发者在图像生成中难以保持风格一致或做精准编辑?Gemini 2.5 Flash Image 实测可通过自然语言完成多图融合和局部转换,生成一张图成本仅约 $0.039,马上体验融合与编辑的新路径。
3个月前