通義千問720億參數(shù)模型宣布開源,部分性能超越閉源GPT-4
導讀: 新浪科技訊 12月1日午間消息,阿里云通義千問720億參數(shù)模型Qwen-72B今日宣布開源。該模型基于3T tokens高質(zhì)量數(shù)據(jù)訓練,在10個權(quán)威基準測評中奪得開源模型最優(yōu)成績,在部分測評中超越閉源GPT-3 5和GPT-4。
新浪科技訊 12月1日午間消息,阿里云通義千問720億參數(shù)模型Qwen-72B今日宣布開源。該模型基于3T tokens高質(zhì)量數(shù)據(jù)訓練,在10個權(quán)威基準測評中奪得開源模型最優(yōu)成績,在部分測評中超越閉源GPT-3.5和GPT-4。
在英語任務(wù)上,Qwen-72B在MMLU基準測試取得開源模型最高分;中文任務(wù)上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準得分超越GPT-4;數(shù)學推理方面,Qwen-72B在GSM8K、MATH測評中斷層式領(lǐng)先其他開源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測評中的表現(xiàn)大幅提升,代碼能力有了質(zhì)的飛躍。
據(jù)介紹,Qwen-72B可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發(fā)團隊優(yōu)化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游應(yīng)用集成。比如,Qwen-72B搭載了強大的系統(tǒng)指令(System Prompt)能力,用戶只用一句提示詞就可定制AI助手,要求大模型扮演某個角色或者執(zhí)行特定的回復任務(wù)。
隨著Qwen-72B的開源,通義千問還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型。
責任編輯:zsz
網(wǎng)友評論
智能應(yīng)用排行
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開發(fā),上線 HarmonyOS
- 蘋果官方認可“越獄”術(shù)語:特殊版iPhone罕見現(xiàn)身 用于查找
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量傾斜,成電商
- 釘釘公布數(shù)據(jù):用戶數(shù)7億 軟件付費企業(yè)數(shù)12萬
- AI大模型讓智慧交通“更聰明” 海信亮相2024世界人工智能大
- 沃爾瑪?shù)娜斯ぶ悄芰闶鄣暌严蚬婇_放
- 歐瑞博攜手南方科技大學打造智能新能源住宅技術(shù)聯(lián)合實驗室
- 都是科技的狠活?2024中國國際消費電子博覽會即將全新亮相
- 百度:智能云業(yè)務(wù)Q1營收47億元,生成式AI貢獻比例達6.9%
延伸閱讀
最新智能應(yīng)用
- 京東11.11再次發(fā)力數(shù)字人:成本更低、直播流量傾
- 歐瑞博攜手南方科技大學打造智能新能源住宅技術(shù)聯(lián)
- 網(wǎng)易 UU 加速器完成鴻蒙原生應(yīng)用開發(fā),上線 H
- 都是科技的狠活?2024中國國際消費電子博覽會即將
- 百度沈抖:百舸4.0升級發(fā)布,模型訓練有效時長達
- 華為云發(fā)布AI原生云基礎(chǔ)設(shè)施架構(gòu)CloudMatrix,新
- 阿里CEO吳泳銘:AI算力需求滲透率已超50%,正主導
- 羅技發(fā)布 G PRO 2 LIGHTSPEED(GPW4 朱雀)
- 華為:將啟動“鴻蒙生態(tài)伙伴及開發(fā)者見非凡體驗計
- 華為運動健康發(fā)布玄璣感知系統(tǒng) 華為手表或?qū)⒅С?/a>