阿里巴巴推出最新AI模型Qwen3聲稱可與Google和OpenAI匹敵
廣告
阿里巴巴周一正式發布最新人工智能模型「通義千問」Qwen3,並聲稱其性能可媲美Google和OpenAI的頂級AI模型。這款模型已在香港上線,並且大多數型號都可以在AI開發平台Hugging Face和GitHub上以開放許可下載。Qwen3的參數大小範圍從6億到2350億不等,標誌著中國原創AI技術的進一步崛起,對美國AI實驗室形成了新的競爭壓力。
混合模型更快更準
阿里巴巴表示,Qwen3是一種「混合」模型,結合了思維模式和非思維模式,讓用戶能靈活控制思維預算。這意味著它既能花時間推理複雜問題,也能快速回答簡單請求。部分型號採用了專家混合(MoE)架構,通過將任務分解為子任務並委託給專門的「專家」模型來提高運算效率。
Qwen3支持多達119種語言,並基於包含近36兆代幣的資料集進行訓練。其訓練內容包括教科書、「問答對」、程式碼片段以及人工智能生成的資料。相比前代Qwen2,Qwen3的功能有了顯著提昇,儘管其性能未能超越OpenAI的最新o3和o4-mini模型,但仍然表現強勁。
「Qwen3模型是『混合』模型,整合了思維和非思維模式,為用戶提供了控制思維預算的靈活性,可以花時間推理複雜的問題或快速回答更簡單的請求。」
實力比對手更強
在程式設計競賽平台Codeforces上,Qwen3的最大型號Qwen-3-235B-A22B成功擊敗了OpenAI的o3-mini和Google的Gemini 2.5 Pro。此外,在最新版本的AIME(挑戰性數學基準)和BFCL(評估模型「推理」能力的測試)方面,Qwen-3-235B-A22B也表現優於o3-mini,儘管該型號尚未公開。
最大的公共Qwen3模型Qwen3-32B則在多項測試中超越了OpenAI的o1模型,包括編碼基準LiveCodeBench。阿里巴巴表示,Qwen3在工具呼叫能力、遵循指令以及複製特定資料格式方面「表現出色」。
「Qwen3在工具呼叫能力以及遵循指令和複製特定資料格式方面『表現出色』。」
消息來源:TechCrunch