标签为 #Qwen3-TTS# 的博客

聚焦人工智能、大模型与深度学习的精选内容，涵盖技术解析、行业洞察和实践经验，帮助你快速掌握值得关注的AI资讯。

阿里通义千问团队首次开源语音合成大模型：Qwen3-TTS：总共5个模型，最小的仅0.6B参数规模，最大1.8B参数

就在刚刚，阿里开源了全新的语音合成大模型Qwen3-TTS系列！本次开源的语音合成模型共5个版本，最小的仅0.6B参数规模，最大的模型参数也就1.7B，基本上手机端都可以运行。此次发布不仅在性能上宣称超越了许多商业级闭源模型（如 OpenAI 的 GPT-4o-Audio 和 ElevenLabs），更重要的这应该是阿里通义千问团队首次开源语音合成系列大模型。

2026/01/22 22:22:53 阅读 807

Qwen/Qwen3-TTS/语音克隆/语音合成大模型/语音设计

阿里一次发布3款Qwen大模型：开源的全模态Qwen3-Omni和图像编辑大模型Qwen-Image-Edit-2509和不开源的语音识别大模型Qwen3-TTS

几个小时前，阿里一次更新了3个大模型，分别是开源的全模态大模型Qwen3-Omni、开源的图像编辑大模型Qwen3-Image-Edit和不开源的语音识别大模型Qwen3-TTS。本次发布的3个模型均为多模态大模型，可以说阿里的大模型真的是全面开花，节奏很快！

2025/09/23 09:40:47 阅读 521

Qwen-Image-Edit/Qwen3-Omni/Qwen3-TTS

最新博客

阿里通义千问团队首次开源语音合成大模型：Qwen3-TTS：总共5个模型，最小的仅0.6B参数规模，最大1.8B参数

阿里一次发布3款Qwen大模型：开源的全模态Qwen3-Omni和图像编辑大模型Qwen-Image-Edit-2509和不开源的语音识别大模型Qwen3-TTS