Qwen3-ASR-Flash – 阿里通义录音文件识别模型阿里通义千问Qwen3-ASR-Flash是一款高精度语音识别模型,支持11种语言及多种方言口音。其创新上下文引导机制可定制识别结果,提升专业术语准确率。在复杂噪声环境、歌声转写(错误率低于8%)及多...AI项目和框架# ai模型# 语音文件识别# 语音模型2个月前
Seedream 4.0 – 字节跳动多模态4K图像生成模型|免费AI创作工具Seedream 4.0是字节跳动推出的新一代多模态图像模型,支持4K高清生成与编辑,融合文本+图像输入,实现多图融合、风格迁移、精准修图,10倍提速,适用于电商、设计、影视创作。AI项目和框架# AI图像框架# ai模型# 字节跳动2个月前
混元图像 2.1 – 一种用于高分辨率(2K)文本到图像生成的高效扩散模型寻找能生成高质量2K图像且原生支持中文的开源AI绘画模型?腾讯混元图像2.1来了!本文带你详细了解其原理、优势,并提供从环境配置到生成第一张图片的完整指南,附赠PromptEnhancer提示词优化技...AI项目和框架# AI图像框架# Tencent# 混元大模型2个月前
Karpathy发布全新Vibe Coding指南,提出三层AI编程结构Andrej Karpathy提出三层AI编程架构,通过Cursor自动补全(75%日常任务)、Claude Code功能实现、GPT-5 Pro深度调试的分层协作,重塑开发效率模型。本文详解架构设计...AI快讯2个月前
阿里通义APP上线形象自定义功能,可自由设定AI助手形象、声音等。通义APP上线全新形象自定义功能,支持更换助手形象、克隆声音、设定人设,打造专属AI分身。提供20+音色选择,AI帮写人物设定,开启个性化智能交互体验。AI快讯# 阿里巴巴2个月前
9月1日起AI合成内容须打“电子水印”,无标识内容可举报。2025年9月1日起施行的《人工智能生成合成内容标识办法》要求所有AI合成内容必须添加显式和隐式电子水印,未标识内容可向平台举报。本文解析新规核心要求、技术实现及公众应对策略。AI快讯# AI法规2个月前
谷歌翻译推出全新语言学习工具挑战多邻国,新增实时交流功能。谷歌翻译集成Gemini模型推出语言学习工具,支持个性化听说练习与实时跨语言对话,覆盖70+语种,挑战多邻国市场地位。AI快讯# Gemini# 谷歌2个月前
Robomart推出自动驾驶配送机器人,单次配送10单,每单3美元降成本。洛杉矶初创公司Robomart推出L4级自动驾驶配送机器人RM5,通过10单批量配送和3美元固定费率,将配送成本降低70%。这一创新模式挑战DoorDash等传统平台,计划在奥斯汀率先落地。AI快讯# Robomart# 具身智能2个月前
X-energy与亚马逊合作研小型模块化反应堆,供数据中心和AI电力需求。亚马逊联合X-energy、韩国水电核电公司(KHNP)、斗山能源,加速部署第四代小型模块化反应堆(Xe-100),为数据中心与AI算力提供稳定清洁能源,目标2039年前在美国实现超5吉瓦核能供应。AI快讯# 亚马逊2个月前
Ovis2.5 – 原生分辨率视觉模型阿里国际最近放出了新一代多模态大模型 Ovis2.5,一口气带来 9B(90 亿参数)和 2B(20 亿参数)两个版本 —— 这俩可不简单,直接把开源模型的性能纪录给刷新了。更值得关注的是它的三大升级...AI项目和框架# ai模型# ai视觉模型# 阿里巴巴2个月前