華為昇騰連夜適配千問(wèn)3
在阿里通義千問(wèn)模型Qwen3(簡(jiǎn)稱千問(wèn)3)模型開源數(shù)小時(shí)后,,華為官方宣布昇騰支持千問(wèn)3全系列模型部署,,開發(fā)者在MindSpeed和MindIE中開箱即用,實(shí)現(xiàn)千問(wèn)3的0Day適配,。
據(jù)悉,千問(wèn)3是國(guó)內(nèi)首個(gè)“混合推理模型”,,“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,,對(duì)簡(jiǎn)單需求可低算力“秒回”答案,對(duì)復(fù)雜問(wèn)題可多步驟“深度思考”,,大大節(jié)省算力消耗,。華為官方表示,千問(wèn)3的旗艦?zāi)P?Qwen3-235B-A22B 在代碼,、數(shù)學(xué),、通用能力等基準(zhǔn)測(cè)試中,與 DeepSeek-R1,、o1,、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級(jí)模型相比,,表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果,。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活參數(shù)數(shù)量是 QwQ-32B 的 10%,,表現(xiàn)更勝一籌,,甚至像 Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能,。
此前華為昇騰就一直同步支持千問(wèn)系列模型。昇騰MindSpeed訓(xùn)練,、MindIE推理支持千問(wèn)2.5,、兼容主流生態(tài)的分布式并行接口等,千問(wèn)3系列模型一發(fā)布即實(shí)現(xiàn)低代碼無(wú)縫遷移,。