千问 App 实测:开源之王杀入消费市场,国产 AI 是否会重新洗牌?

IP归属:广东

文章AI导读

一键萃取文章精髓,核心观点即刻呈现

Qwen 或者说通义千问相信大家都不陌生,但过去常常都是在企业市场上看到它的身影,比如今年开始走量的魅族、雷鸟等品牌的 AI 眼镜,他们背后使用的 AI 大模型就是通义千问。

图源:Qwen

如果回到熟悉的消费市场,不少用户常用的国产 AI 大模型产品可能会是豆包、DeepSeek 和 Kimi,或许是为了在消费者市场也能占据一定市场,阿里巴巴在 11 月 17 日面向公众推出了「千问 App」公测版,千问 App 背靠阿里最强的开源模型 Qwen3,并同步宣布国际版即将上线。

图源:Qwen

在千问 App 推出之际,我们不妨也测试一下它的真实实力,在那之前我们不妨先回顾一下通义千问(Qwen)在过去这些年里的发展。

开源制胜,Qwen 后来居上成为全球最强开源大模型

Qwen 模型系列从诞生之初,就一直坚持采用 Apache 2.0 开源许可证,这一策略是其社区成功的基石。Apache 2.0 许可提供了更大的商业使用自由,允许企业将 Qwen 模型集成到其专有产品和商业服务中,且对模型衍生和修改没有严格限制。反观 Llama 模型,Meta 虽然也声称 Llama 模型是开源模型,但却严格限制了其商业使用。

这种最大化的开放策略,有效地消除了企业在选择模型时的法律顾虑,加速了 Qwen 在企业和开发者社区中的采纳率,使其能够比采用更具限制性许可条款的竞争对手更快地建立生态优势。

这也让 Qwen 后来居上,如今已经超越了更早诞生的 Llama 模型,成为全球性能最强、应用最广泛的开源大模型。截至目前,Qwen 系列模型的全球下载量已突破 6 亿次。

图源:网络

不光是下载量,如果要衡量一个开源项目的健康度、稳定性和实用性,那么其衍生模型的数量也是一个重要的衡量指标。根据全球最大的 AI 开源社区 Hugging Face 的最新数据显示,截至目前,阿里通义千问开源大模型的衍生模型数量已突破 10 万。

这一惊人的数量,反映了开发者生态的深度参与和活跃度,同时也证明了 Qwen 模型的底层工具链、文档和微调过程是高效且易于使用的。

从 10 万衍生模型的数据可以看出,Qwen 的技术底座足够扎实。而这种扎实,在最新的 Qwen3 系列上体现得更加明显。该系列通过引入混合专家模型(MoE)的高效架构和创新的“思考模式”(Thinking Mode),显著提升了性能和推理效率。

图源:Qwen

阿里还推出了业界首个原生端到端全模态 AI 模型 Qwen3-Omni,支持文本、图像、音频、视频等多种输入形式,并能实时流式生成文本与语音输出。模型在 36 项音频及音视频基准测试中斩获 32 项开源 SOTA 与 22 项总体 SOTA,整体性能超越 Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe 等国际主流闭源模型。

图源:Qwen

面向如火如荼的 Vibe Coding 领域,阿里在 7 月也带来了 Qwen3-Coder。该模型采用 4800 亿参数的 Mixture-of-Experts 架构,激活参数 350 亿,原生支持 256K tokens 超长上下文,借助 YaRN 技术可扩展至 100 万 tokens,刷新了开源模型在 Agentic Coding、浏览器自动化和工具调用等多项任务上的表现。

千问 App 初体验:功能大而全,但短板同样明显

技术实力已经得到验证,那么当 Qwen3 被封装进面向普通消费者的千问 App 后,实际体验究竟如何?接下来我们就来一探究竟。

左:千问;右:豆包;图源:前方智能

千问 App 主打一个大而全,基本上把大家耳熟能详的那些 AI 功能全带上了——深度思考、翻译、音频转录、PPT 创作、AI 生图、AI 生视频、AI 修图等一应俱全,为了方便用户使用,这些功能都一字排列在了输入框上方,整体设计跟豆包有些类似。

左:千问;右:ChatGPT;图源:前方智能

基础能力方面,千问 App 的表现符合预期。首先是经典物理学信息查询,千问 App 与 GPT-5.1 给出的答案几乎完全一致,公式运用、原理解释都非常清晰,仅有措辞上的一点点区别。

图源:前方智能

更考验模型能力的编程任务上,千问 App 同样能力不俗,我们让它使用 Python 实现一个 LRU 缓存淘汰算法,代码生成的速度非常快,整体代码格式与可用性也都不错。虽然有一点小问题(比如节点之间存在prevnext互相引用,虽然 Python 有垃圾回收机制,但在某些情况下可能延迟回收),但瑕不掩瑜,千问 App 给出的代码包含了详细注释、解释了选择这种数据结构的原因、包含完整的单元测试,这些都算是加分项。

图源:前方智能

为了进一步验证其实战能力,我们稍微加大一点难度,让千问 App 进行实际应用开发,制作一个 3D 魔方的模拟程序,最终生成的代码与效果同样不俗,3D 模型支持自由旋转,动画也非常流畅。

当然,在测试过程中,我们发现千问 App 也并非样样精通。在看似最基础的信息检索任务中,千问 App 却出人意料地“翻了车”,出现了多处信息错误。

图源:前方智能

我让千问 App 对比目前市面上的多款旗舰手机,并给出购买建议。光是参数对比图中就出现了多处错误,比如 iPhone 17 Pro Max 实际上是 4 倍光学变焦,而千问 App 提供的结果是 5 倍光学变焦;iPhone、三星的芯片信息也存在错误,正确信息应该是 A19 Pro 和骁龙 8 至尊版 for Galaxy。

基本的参数对比图表有错误,那么后续给出的购买建议自然也是基于错误信息给出的,没有什么参考价值。

除了文本和代码能力, 作为主打“全能”的 AI 应用,千问 App 的多模态生成能力同样值得关注。我们测试了视频生成功能,发现现阶段视频的帧与帧之间还不是特别连贯,有一定的跳跃感,缺乏真实感,虽然可以生成文字,但效果不一致,容易崩坏。

结尾

经过一轮测试下来,千问 App 的实力轮廓已经基本清晰。整体来看,千问 App 作为阿里巴巴在消费级 AI 市场的首次发力,展现出了不俗的技术底蕴——编程能力、逻辑推理等核心功能表现可圈可点,但在最基本的信息检索准确性上“翻车”是令人非常意外的。

不过,千问 App 的真正优势或许并不仅在于模型能力本身。背靠阿里巴巴庞大的生态体系,千问 App 拥有其他 AI 应用难以企及的场景优势——淘宝天猫的电商数据、高德地图的出行服务、闪购的外卖配送、支付宝的生活缴费……这些深度融入国人日常生活的场景,一旦与千问 App 打通,将赋予它远超单纯对话助手的办事能力。这种从"能聊"到"能办"的跨越,或许才是千问 App 在激烈竞争中杀出重围的关键。

眼下,豆包、DeepSeek、Kimi 们已经跑在前面,但千问 App 手握阿里生态这张王牌,这场消费级 AI 市场的争夺战才刚刚开始。

陀螺科技现已开放专栏入驻,详情请见入驻指南: https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏: https://www.tuoluo.cn/columns/author1911845/

本文网址: https://www.tuoluo.cn/article/detail-10126883.html

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

相关文章