通义千问(英文名:Tongyi Qianwen)是阿里云自主研发的大语言模型,是 AIGC 领域的重要应用,也是 MaaS 的底座。以下是其详细简介:
- 发展历程:2023 年 4 月 7 日,通义千问开始邀请测试,主要面向企业用户。4 月 11 日,在 2023 阿里云峰会上正式揭晓。9 月 13 日,通义千问大模型通过首批备案,正式向公众开放,其 APP 也在各大手机应用市场上线。2023 年 10 月 31 日,阿里云在云栖大会上正式升级发布通义千问 2.0,模型参数达到千亿级别。2024 年 6 月 7 日,阿里通义千问 Qwen2 大模型发布,并在 Hugging Face 和 ModelScope 上同步开源。2025 年 1 月 29 日,阿里云通义千问旗舰版模型 Qwen2.5-Max 正式发布。4 月 29 日,阿里巴巴开源新一代通义千问模型 Qwen3,这是中国首个 “混合推理模型”。
- 模型特点:通义千问发展出了文生图、智能编码、文档解析、音视频理解等能力。它推出了参数规模横跨 5 亿到 1100 亿的八款大语言模型,小尺寸模型可便捷地在手机、PC 等端侧设备部署,大尺寸模型能支持企业级和科研级的应用,中等尺寸模型则在性能、效率和内存占用之间找到平衡点。此外,通义千问还开源了视觉理解模型、音频理解模型、代码模型、混合专家模型等多种类型的模型。
- 性能表现:通义千问的多个模型在各类基准测评中表现优异。例如,Qwen1.5-110B 在 MMLU、TheoremQA、GPQA 等基准测评中超越了 Meta 的 Llama-3-70B 模型,在 HuggingFace 推出的开源大模型排行榜 Open LLM Leaderboard 上冲上榜首。通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中得分超越 Gemini Ultra 和 GPT-4V。
- 应用场景:基于通义大模型,阿里云针对不同行业领域开发了通义灵码、通义智文、通义听悟、通义星尘、通义点金、通义晓蜜、通义仁心、通义法睿等 8 个行业应用模型,可应用于智能编码、文档处理、语音识别、金融、电商、医疗、法律等多个领域。