vivo BlueLM-2.5-3B发布:首款支持GUI理解的端侧多模态模型vivo AI Lab最新推出的**BlueLM-2.5-3B**多模态模型,专为移动端设计,以**2.9B超小参数量**实现文本推理、GUI界面理解、图文交互等复杂能力。在20余项权威评测中超越同规...AI快讯6个月前
Vidu Q1:7张图搞定电影级视频!角色一致+多元素同框+零分镜生成生数科技推出的Vidu Q1视频大模型全新升级“参考生”功能,支持上传7张参考图(人物/场景/道具)一键生成多角色同框的高清视频,彻底解决AI视频中角色崩坏、分镜繁琐的痛点。本文详解其5大核心功能的技...AI快讯6个月前
Hugging Face开源3B参数模型SmolLM3:多语言推理新标杆,性能碾压同级Hugging Face最新开源的**30亿参数模型SmolLM3**,以同级最小的体型实现最先进的性能表现。它不仅**超越Llama-3.2-3B等同类模型**,更在多项任务中媲美40亿参数的Gem...AI快讯6个月前
越疆六足仿生机器狗:三角支撑结构如何实现稳定性碾压式突破越疆全球首发六足仿生机器狗,凭借三角支撑三点触地结构实现5倍自重负载与全地形稳定通行,突破能源巡检、灾难救援场景的技术瓶颈。了解六足vs四足结构的技术对比与工业4.0创新应用。AI快讯6个月前
智元机器人:运动控制模型让机器人行走更精准更智能!智元机器人关联公司上海智元新创公布机器人运动控制模型训练方法专利,通过对比足部动作的预期与实际接触序列,生成负反馈激励值优化模型参数,显著提升机器人运动控制精度与地形适应性。AI快讯6个月前
Hugging Face Reachy Mini桌面机器人:开发者AI应用开发Hugging Face最新推出的Reachy Mini桌面机器人——一款专为开发者设计的开源硬件平台。产品含Lite版(299美元)和无线版(449美元),支持Python编程并深度集成Huggin...AI快讯6个月前
小米AI双突破:Q-Frame视频理解与Any-SSR持续学习框架小米AI团队在计算机视觉顶会ICCV 2025发表两项突破性成果:视频理解技术Q-Frame实现动态帧选择与分辨率自适应,攻克视频信息碎片化难题;持续学习框架Any-SSR创新解决大模型“灾难性遗忘...AI快讯6个月前
昆仑万维开源Skywork-R1V 3.0:多模态模型高考数学142分,性能超越Claude与GPT昆仑万维开源多模态模型Skywork-R1V 3.0在MMMU评测获76.0分,高考数学142分,物理与逻辑推理性能全面领先。提供模型部署指南、核心功能解析及免费下载地址。AI快讯6个月前
谷歌Veo 3:单图生成音视频+跨镜头角色一致性|AI视频生成教程谷歌Veo 3迎来革命性升级,**仅需单张静态图片**即可生成带音频的动态视频,突破性实现**多镜头角色一致性**,支持专业运镜控制。本文将深度解析其核心功能、技术原理及实战技巧,助你一键解锁AI视...AI快讯6个月前
硅谷AI人才争夺战升级!OpenAI反挖四位巨头技术核心,剑指“星际之门”OpenAI从特斯拉、xAI和Meta引入4名顶尖工程师,加速百万GPU超级计算机「星际之门」建设,揭秘硅谷AI人才争夺战背后的AGI竞赛真相AI快讯6个月前