阿里云通義千問多模態大模型Qwen-VL-Max重磅升級

若安丶 ? 2024年1月27日 20:28:00 ? AI

阿里云昨日公布了其多模態大模型研究的新進展，推出了升級版的通義千問視覺理解模型Qwen-VL-Max。這款模型在視覺推理能力和中文理解能力上都有了顯著提升，性能表現堪比GPT-4V和谷歌的Gemini Ultra。

Qwen-VL-Max的升級主要表現在以下幾個方面：

基礎能力：Qwen-VL-Max能夠準確描述和識別圖片信息，并基于圖片進行信息推理和擴展創作。它還具備了視覺定位能力，能夠對畫面指定區域進行問答。
視覺推理：新版模型能夠理解流程圖等復雜形式圖片，并能夠分析復雜圖標。此外，它在看圖做題、看圖作文以及看圖寫代碼等任務上也達到了世界最佳水平。
圖像文本處理：Qwen-VL-Max的中英文文本識別能力顯著提高，支持百萬像素以上的高清分辨率圖和極端寬高比的圖像。它既能夠完整復現密集文本，也能從表格和文檔中提取信息。

與LLM（大語言模型）相比，多模態大模型擁有更大的應用想象力。例如，研究者正在探索將多模態大模型與自動駕駛場景結合，為“完全自動駕駛”找到新的技術路徑。此外，將多模態模型部署到手機、機器人、智能音箱等端側設備，可以讓智能設備自動理解物理世界的信息，或者基于多模態模型開發應用，輔助視力障礙群體的日常生活等等。

Qwen-VL-Plus和Qwen-VL-Max目前限時免費，用戶可以在通義千問官網、通義千問APP直接體驗Max版本模型的能力，也可以通過阿里云靈積平臺（DashScope）調用模型API。

總的來說，阿里云的通義千問多模態大模型Qwen-VL-Max在視覺推理和中文理解方面都展現出了強大的實力，其性能表現足以與GPT-4V和谷歌的Gemini Ultra相媲美。這將為用戶提供更豐富、更準確的視覺信息理解和創作能力，推動AI技術在更多領域的應用和發展。

原創文章，作者：若安丶，如若轉載，請注明出處：http://www.bdzhitong.com/article/624926.html

Qwen-VL-Max Qwen-VL-Max升級通義千問多模態大模型Qwen-VL-Max 通義千問多模態大模型Qwen-VL-Max升級阿里云

若安丶管理團隊

0 0

出海

阿里云墨西哥數據中心開服，拉美云服務市場迎來新篇章

今日，云計算領域的巨頭阿里云宣布了一個令人振奮的消息：其墨西哥數據中心正式投入運營！這不僅標志著阿里云在拉美區域邁出了堅實的第一步，更預示著它將為南美市場帶來全新的變革。據悉，這…

李小白
4天前
新聞

阿里云盤的“隱形收費”：用戶信任的崩塌與平臺的失責

近年來，隨著云存儲服務的普及，阿里云盤作為國內頭部云服務商，憑借其大容量和高速傳輸的優勢，吸引了大量用戶。然而，近期多名用戶在黑貓投訴平臺反映，阿里云盤的會員服務存在“自動續費無顯…

NEWS
2025年2月14日
新聞

阿里云官宣DeepSeek模型一鍵部署，R1與V3版本云上輕松獲取

昨日，阿里云計算有限公司在其官方平臺宣布，阿里云PAI Model Gallery現已支持DeepSeek-V3與DeepSeek-R1模型的一鍵部署功能。這一消息標志著DeepS…

野游栗
2025年2月4日
新聞

UALink聯盟新增成員：蘋果、阿里云與新思科技強勢加盟

近日，UALink聯盟宣布迎來新成員——阿里云、蘋果和新思科技（Synopsys）正式加入其董事會。據了解，UALink聯盟自2024年10月由AMD、亞馬遜AWS等9家企業發起成…

NEWS
2025年1月15日
新聞

雷鳥創新與阿里云達成戰略合作，引領 AI大模型與AR眼鏡融合新紀元

雷鳥創新與阿里云達成AI眼鏡獨家戰略合作，阿里云通義大模型提供技術支持。雙方將共同研發，提升AI眼鏡交互體驗。雷鳥V3AI拍攝眼鏡將搭載定制大模型亮相，智能眼鏡或成AI重要橋梁。

潮玩君
2025年1月3日
出海

全球公有云平臺Wave評估報告發布阿里云全球排名第二

近日，全球權威研究機構Forrester發布了其最新的公有云平臺Wave評估報告，全面評估了全球主要公有云廠商的技術能力與戰略布局。根據評估結果，阿里云與亞馬遜AWS、微軟Azur…

科技探索者
2024年12月4日
出海

阿里云發布全新國際生態伙伴計劃，激勵合作伙伴推動技術創新

昨日，阿里云正式對外宣布了全新國際生態伙伴計劃，旨在攜手全球合作伙伴共同推動云計算和人工智能技術的創新與發展。據悉，該計劃出臺了一系列激勵政策，以吸引更多的技術伙伴加入。其中，阿…

李小白
2024年12月4日
新聞

阿里云加大香港市場投入，推出“香港科技創未來”計劃

昨日，阿里云宣布將加大香港市場投入，推出“香港科技創未來”計劃。并增強對本土企業和上臺伙伴的AI技術支持和人才培育。作為香港排名第一的云計算IaaS服務提供商，阿里云營收保持雙位…

李森
2024年11月28日
商業

阿里集團CEO吳泳銘：AI最大的想象力在于改變物理世界

阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘：“?過去22個月，AI發展速度超過任何歷史時期，但我們依然還處于AGI變革的早期。生成式AI最大的想象力，絕不是在手機屏幕上做一兩個新的超級app，而是接管數字世界，改變物理世界。”

藍鯊硬科技
2024年9月21日
AI

阿里云通義千問發布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens長上下文

今日，阿里云通義千問（Qwen）宣布，經過數月的持續研發和優化，其AI開源模型系列已升級至Qwen2，并在Hugging Face和ModelScope上同步開源。此次升級不僅引入…

AI
2024年6月7日
AI

百度文心大模型ENIRE Speed和ENIRE Lite全面免費，加速AI應用普及

在人工智能領域的激烈競爭中，百度文心大模型近日宣布了一項重磅消息：其兩款主力模型ENIRE Speed和ENIRE Lite將全面免費開放使用，即刻生效。這一舉措無疑將對整個行業產…

百度
2024年5月21日
AI

阿里云發布通義千問2.5大模型，能力全面升級，趕超GPT-4

昨日，在阿里云AI智領者峰會-北京站活動中，阿里云正式發布了通義千問2.5大模型，并宣稱其在多項能力上已全面趕超GPT-4，尤其在中文語境下的表現尤為突出。據阿里云官方介紹，通義…

科技新聞
2024年5月10日
AI

阿里云通義千問開源320億參數大語言模型，全系列已達七款

4月7日，阿里云宣布通義千問成功開源其最新的320億參數大語言模型——Qwen1.5-32B，至此通義千問已完成包括5億、18億、40億、70億、140億和720億參數在內的全系列…

科技新聞
2024年4月8日
AI

阿里云啟用AI編程助手通義靈碼，助力程序員提升效率

近日，阿里云在內部全面推行AI編程，借助通義靈碼這一智能編程助手，幫助程序員編寫代碼、閱讀代碼、檢查BUG以及優化代碼等工作。這一創新舉措標志著阿里云在智能化編程領域邁出了重要的一…

泡沫大盜
2024年4月3日
新聞

阿里云宣布通義千問720億參數模型開源

今日，阿里云宣布開源通義千問 720 億參數模型 Qwen-72B、18 億參數模型 Qwen-1.8B 及音頻大模型 Qwen-Audio，目前已上線阿里魔搭社區。

秋秋
2023年12月1日
新聞

阿里巴巴：吳泳銘接替張勇，阿里云智能集團分拆計劃繼續進行

阿里巴巴宣布吳泳銘先生將接替張勇先生出任阿里云智能集團代理董事長兼首席執行官，委任于 2023 年 9 月 10 日生效

科技探索者
2023年9月11日
張勇發全員信：阿里云將分拆上市

阿里巴巴宣布啟動「1+6+N」組織變革以來，首個正式宣布「單飛」的業務落子阿里云智能集團

蘋果派
新聞 2023年5月19日
阿里云域名價格調整 2月1日起net英文域名續費上調至89元

據阿里云官網顯示，阿里云日前發布域名價格調整通知。

若安丶
新聞 2023年1月16日
阿里巴巴組織架構大調整集團CEO張勇兼任阿里云智能總裁

昨日，阿里巴巴集團董事會主席兼CEO張勇發出全員郵件，宣布組織變化，并將新年關鍵字定為“進”。

若安丶
新聞 2022年12月30日
阿里云正式發布“汽車云”：已服務國內超70%汽車企業

阿里云“汽車云”在 2022云棲大會上正式亮相。目前，阿里云“汽車云”在國內已服務超過70%的汽車企業，小鵬、一汽、吉利、長城、長安、地平線等均已上云。

若安丶
智車 2022年11月7日

發表回復

登錄后才能評論

阿里云通義千問多模態大模型Qwen-VL-Max重磅升級

相關推薦

發表回復