阿里巴巴雲端嘅Qwen團隊喺2025年7月22號正式發佈咗Qwen3-Coder,呢個係佢哋最新嘅大型語言模型系列中專為編程設計嘅版本,標誌住人工智能喺代碼生成同自動化領域嘅重大突破。Qwen3-Coder唔單止係一個普通嘅編程工具,而係一個具備高度「智能代理」(Agentic)能力嘅模型,佢可以喺複雜嘅編程任務中同環境互動,執行多輪決策同工具使用,表現同業界頂尖嘅Claude Sonnet 4不相上下。呢個模型一出世,就喺開源模型中創下咗新嘅標杆,特別係喺代碼生成、瀏覽器使用同工具調用等智能代理任務上,佢嘅表現真係令人眼前一亮。
Qwen3-Coder嘅旗艦版本係Qwen3-Coder-480B-A35B-Instruct,呢個係一個擁有4800億參數嘅混合專家(Mixture-of-Experts, MoE)模型,當中35億係活躍參數,支援原生256K token嘅上下文長度,仲可以通過YaRN技術擴展到100萬token。呢種超長上下文嘅能力,令到Qwen3-Coder可以輕鬆處理大型代碼庫同複雜嘅開源項目,例如GitHub上嘅Pull Requests同全庫分析。喺SWE-Bench Verified等真實世界軟件工程任務中,Qwen3-Coder無需測試時擴展,就已經喺開源模型中取得咗最頂尖嘅成績,顯示出佢喺實際應用中嘅強大潛力。
除咗強大嘅性能,Qwen3-Coder仲同業界主流開發工具無縫整合,例如Qwen Code(一個由Gemini Code改進而來嘅命令行工具),支援定制化嘅提示同功能調用協議。呢啲工具唔單止提升咗模型喺智能代理任務上嘅表現,仲大大簡化咗開發者嘅工作流程。Qwen3-Coder嘅訓練過程亦都係一個亮點,佢用咗75億token嘅數據(當中70%係代碼相關),並通過Qwen2.5-Coder清理同重寫數據,確保數據質量極高。喺後訓練階段,Qwen團隊引入咗長視野強化學習(Agent RL),利用阿里巴巴雲端嘅基礎設施,同時運行20,000個獨立環境,模擬真實世界嘅多輪互動同工具使用場景,令模型喺解決複雜任務時更加得心應手。
用戶同開發者社群對Qwen3-Coder嘅反應熱烈。喺Hacker News同Reddit等平台上,開發者讚揚佢喺代碼生成同工具使用上嘅高效同穩定性。雖然佢需要強大嘅硬件支援(例如高VRAM需求),但社群普遍認為,對於擁有高端計算資源嘅團隊同企業,Qwen3-Coder係一個理想嘅選擇。同時,Qwen團隊亦都承諾會推出更多尺寸嘅模型,方便中小型開發者使用,進一步降低部署成本。佢哋仲提到探索代碼代理自我改進嘅可能性,呢個方向令人期待未來嘅突破。總括而言,Qwen3-Coder唔單止係一個編程工具,更係開源AI領域嘅一個里程碑,為全球嘅智能編程開闢咗新嘅可能性。
想了解更多詳情,請瀏覽:https://qwenlm.github.io/blog/qwen3-coder/