全面趕超GPT4 Turbo,阿里云發(fā)布通義千問2.5,地表最強中文大模型

全面趕超GPT4 Turbo,阿里云發(fā)布通義千問2.5,地表最強中文大模型

chenqimei 2025-03-30 百科 11 次瀏覽 0個評論

來源:@首席數(shù)智官

5月9日消息,阿里云正式發(fā)布通義千問2.5,模型性能全面趕超GPT-4 Turbo,成為地表最強中文大模型。

通義千問最新開源的1100億參數(shù)模型在多個基準測評收獲最佳成績,超越Meta的Llama-3-70B,成為開源領(lǐng)域最強大模型。

同時,通義大模型品牌升級,“通義千問APP”更名為“通義APP”,集成通義大模型全棧能力,免費為所有用戶提供服務(wù)。通義APP以性能媲美GPT-4 Turbo的基模為底座,并把通義實驗室前沿的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力“All in one”,成為每個人的全能AI助手。

此外,阿里云公布最新數(shù)據(jù),通義大模型通過阿里云服務(wù)企業(yè)超9萬,通義開源模型累計下載量突破700萬。通義落地應(yīng)用進程加速,現(xiàn)已進入PC、手機、汽車、航空、天文、礦業(yè)、教育、醫(yī)療、餐飲、游戲、文旅等領(lǐng)域,成為最受中國企業(yè)歡迎的大模型。

01 地表最強中文大模型

相比通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,中文能力更是持續(xù)領(lǐng)先業(yè)界。在權(quán)威基準OpenCompass上,通義千問2.5得分追平GPT-4 Turbo,是該基準首次錄得國產(chǎn)大模型取得如此出色的成績。

通義還發(fā)布了最新款開源模型,1100億參數(shù)的Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B沖上榜首,再度證明通義開源系列業(yè)界最強的競爭力。

通義的多模態(tài)模型和專有能力模型也具備業(yè)界頂尖影響力。通義千問視覺理解模型Qwen-VL-Max在多個多模態(tài)標準測試中超越Gemini Ultra和GPT-4V,目前已在多家企業(yè)落地應(yīng)用;通義千問代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手,還是國內(nèi)用戶規(guī)模第一的智能編碼助手通義靈碼的底座。

通義大模型問世一年多來,還發(fā)展出了業(yè)界領(lǐng)先的文生圖、智能編碼、文檔解析、音視頻理解等能力,企業(yè)客戶和開發(fā)者可以通過API調(diào)用、模型下載等方式接入通義,個人用戶可從通義APP、官網(wǎng)和小程序免費使用通義家族全棧服務(wù)。

全面趕超GPT4 Turbo,阿里云發(fā)布通義千問2.5,地表最強中文大模型

02 通義App品牌升級

通義意為“通情,達義”,具備全副AI能力,致力于成為人們的工作、學(xué)習(xí)、生活助手。

通義APP擁有超強文檔處理能力,單次可處理多達1000萬字的長文檔,還能同時解析100份不同格式的文檔,是金融、法律、科研、醫(yī)療、教育等領(lǐng)域?qū)I(yè)人士的工作提效利器;基于通義大模型出色的音視頻理解能力,通義APP能夠精準高效地進行音視頻文件的識別理解、摘要總結(jié)、多語言翻譯,可同時上傳處理50個音視頻文件;通義APP還集成了國內(nèi)最受歡迎的智能編碼助手通義靈碼,能幫助所有人隨時隨地在手機上寫代碼、讀代碼、學(xué)習(xí)編程技能。

今年以來,通義APP先后推出了“全民舞王”、“全民唱演”、“通義照相館”、AI智能體等現(xiàn)象級應(yīng)用,在“全民舞王”頻道,用戶上傳一張照片就能跳“科目三”等舞蹈;在“全民唱演”頻道,用戶用一段音頻就能驅(qū)動肖像照中的人物唱歌說話。這些熱門應(yīng)用背后都是通義實驗室自研的前沿AI模型,未來,通義APP還將推出更多以新技術(shù)驅(qū)動的新玩法,讓所有人都能獲得最領(lǐng)先的大模型技術(shù)體驗。

03 更受歡迎的大模型

阿里云AI峰會現(xiàn)場,小米旗下的人工智能助手“小愛同學(xué)”已與阿里云通義大模型達成合作,強化其在圖片生成、圖片理解等方面的多模態(tài) AI 生成能力,并在小米汽車、手機等多類設(shè)備落地;微博、眾安保險、完美世界游戲等企業(yè)也宣布接入通義大模型,將大模型應(yīng)用于社交媒體、保險、游戲等領(lǐng)域。

更早之前,新東方、同程旅行、長安汽車、西部機場集團、親寶寶等企業(yè)也都與通義大模型達成合作。中國科學(xué)院國家天文臺人工智能組基于通義千問開源模型開發(fā)了新一代天文大模型“星語3.0”,這是大模型首次應(yīng)用于天文觀測領(lǐng)域;陜煤建新煤礦等十余座礦山推出由通義大模型支持的新型礦山重大風險識別處置系統(tǒng),成為大模型在礦山場景的首次規(guī)?;涞?。

截至目前,通義大模型通過阿里云服務(wù)企業(yè)超過9萬、通過釘釘服務(wù)企業(yè)超過220萬。與此同時,海內(nèi)外大量中小企業(yè)和開發(fā)者以下載開源模型的方式使用通義,在HuggingFace、魔搭ModelScope等開源社區(qū),通義開源大模型的累計下載量超過了700萬。

by@首席數(shù)智官

轉(zhuǎn)載請注明來自濟南富森木工刀具制造有限公司 ,本文標題:《全面趕超GPT4 Turbo,阿里云發(fā)布通義千問2.5,地表最強中文大模型》

百度分享代碼,如果開啟HTTPS請參考李洋個人博客
每一天,每一秒,你所做的決定都會改變你的人生!

發(fā)表評論

快捷回復(fù):

驗證碼

評論列表 (暫無評論,11人圍觀)參與討論

還沒有評論,來說兩句吧...

Top