C114通信網(wǎng)  |  通信人家園

移動(dòng)平臺(tái)
2025/4/29 21:26

阿里通義已開源200余個(gè)模型,千問3開創(chuàng)全球開源模型性能新高

C114通信網(wǎng)  九九

C114訊 4月29日消息(九九)今日凌晨,阿里巴巴開源新一代通義千問模型Qwen3(簡(jiǎn)稱“千問3”)。

千問3采用混合專家(MoE)架構(gòu),總參數(shù)量235B,激活僅需22B。千問3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強(qiáng),創(chuàng)下所有國(guó)產(chǎn)模型及全球開源模型的性能新高。與此同時(shí),千問3的部署成本還大幅下降,僅需4張H20即可部署千問3滿血版,顯存占用僅為性能相近模型的三分之一。

千問3性能圖

千問3還提供了豐富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斬獲同尺寸開源模型SOTA(最佳性能):千問3的30B參數(shù)MoE模型實(shí)現(xiàn)了10倍以上的模型性能杠桿提升,僅激活3B就能媲美上代Qwen2.5-32B模型性能。

并且,所有千問3模型都是混合推理模型,API可按需設(shè)置“思考預(yù)算”(即預(yù)期最大深度思考的tokens數(shù)量),進(jìn)行不同程度的思考,靈活滿足AI應(yīng)用和不同場(chǎng)景對(duì)性能和成本的多樣需求。比如,4B模型是手機(jī)端的絕佳尺寸,8B可在電腦和汽車端側(cè)絲滑部署應(yīng)用,32B最受企業(yè)大規(guī)模部署歡迎,有條件的開發(fā)者也可輕松上手。

Qwen3開源模型家族

千問3為即將到來的智能體Agent和大模型應(yīng)用爆發(fā)提供了更好的支持。在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中,千問3創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,將大幅降低Agent調(diào)用工具的門檻。同時(shí),千問3原生支持MCP協(xié)議,并具備強(qiáng)大的工具調(diào)用(function calling)能力,結(jié)合封裝了工具調(diào)用模板和工具調(diào)用解析器的Qwen-Agent 框架,將大大降低編碼復(fù)雜性,實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。

據(jù)悉,千問3系列模型依舊采用寬松的Apache2.0協(xié)議開源,并首次支持119多種語言,全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)在魔搭社區(qū)、HuggingFace等平臺(tái)下載模型并商用,個(gè)人用戶也可以立即通過通義APP直接體驗(yàn)千問3。

據(jù)了解,阿里通義已開源200余個(gè)模型,全球下載量超3億次,千問衍生模型數(shù)超10萬個(gè),已超越美國(guó)Llama,成為全球第一開源模型。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141