阿里巴巴開源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

AI ? 2024年4月28日 12:07:00 ? AI

近日，阿里巴巴宣布開源了其Qwen1.5系列中的首個千億參數模型——Qwen1.5-110B。這一舉措不僅彰顯了阿里巴巴在人工智能領域的創新實力，也標志著中國企業在大型語言模型領域取得了顯著進展。

據悉，Qwen1.5-110B模型采用了Transformer解碼器架構，并引入了分組查詢注意力（GQA）技術，使得模型在推理時更加高效。該模型支持長達32K tokens的上下文長度，具備多語言處理能力，支持包括英、中、法、西、德、俄、日、韓、越、阿等在內的多種語言。

在性能評估方面，Qwen1.5-110B模型展現出了與Meta的Llama3-70B模型相媲美的實力。這一成績是在沒有大幅改變預訓練方法的情況下取得的，阿里巴巴方面認為，性能的提升主要歸功于模型規模的增加。這一結果不僅證明了阿里巴巴在模型設計和優化方面的專業能力，也為中國在大型語言模型領域的發展注入了新的活力。

除了在基礎能力評估中表現出色外，Qwen1.5-110B模型在Chat評估中也取得了優異的成績。在MT-Bench和AlpacaEval 2.0這兩個Chat模型基準評估中，該模型相較于之前發布的72B模型表現出了顯著的優勢。這一結果進一步證明了更大規模的基礎語言模型可以帶來更好的Chat模型性能。

阿里巴巴方面表示，Qwen1.5-110B是Qwen1.5系列中規模最大的模型，也是該系列中首個擁有超過1000億參數的模型。這一成就不僅彰顯了阿里巴巴在大型語言模型領域的領先地位，也為中國企業在全球人工智能競爭中贏得了更多的話語權。

隨著人工智能技術的不斷發展，大型語言模型已經成為了各大科技企業的重點研究方向。阿里巴巴此次開源Qwen1.5-110B模型，不僅為開發者提供了更加優秀的工具，也為推動人工智能技術的普及和應用做出了積極的貢獻。

未來，我們期待看到更多中國企業在大型語言模型領域取得突破，為人工智能技術的發展和應用注入更多的活力和創新力量。

原創文章，作者：AI，如若轉載，請注明出處：http://www.bdzhitong.com/article/651113.html

AI認證作者

0 0

出海

?消息稱1688跨境電商新平臺“1688overseas”即將推出

近日，有消息稱，阿里巴巴旗下知名B2B平臺1688即將推出一項重大舉措——跨境電商平臺“1688overseas”。該平臺旨在為全球買家提供更加便捷、高效的采購渠道，特別是針對海外…

小丸子
1天前
新聞

澳大利亞重罰Telegram百萬澳元嚴打平臺有害內容監管漏洞

據報道，澳大利亞在線安全監管機構eSafety今日宣布，對即時通訊平臺Telegram處以100萬澳元（約合人民幣462.6萬元）罰款，因其逾期160天未按要求提交打擊兒童虐待及恐…

NEWS
2天前
商業

?阿里最新財報：國際站GMV七年狂增25倍，股價大漲近15%

阿里巴巴集團昨日發布了其最新一季的財報，表現遠超市場預期，阿里巴巴股價在盤前交易中一度飆升近15%?。在這份亮眼的財報中，B2B跨境電商業務——阿里國際站，成為了眾人矚目的焦點。 …

商業頭條
5天前
商業

深度求索DeepSeek擬啟動首輪融資：阿里、中投或入局

據外媒The Information披露，中國人工智能明星企業深度求索（DeepSeek）正首次考慮引入外部投資。知情人士透露，阿里巴巴集團及主權財富基金中投公司均對此次融資表現出…

商業頭條
6天前
商業

Meta股價連漲16天，市值直逼2萬億大關

最近一段時間，Meta股票在股市中大放異彩，成為人工智能領域的一顆璀璨明珠。盡管周二Meta股價略有回調，但此前Meta股票已經連續16個交易日上漲，期間股價累計漲幅高達17%，M…

happy
2025年2月12日
新聞

Meta“AI讀心術”準確率可達80%，腦機技術實現大腦打字

近日，Meta首席執行官扎克伯格透露了一項令人驚嘆的新技術——Meta“AI讀心術”。據了解，Meta已經成功研發出一種腦機技術，使用戶能夠通過大腦直接輸入文字，準確率高達80%。…

net
2025年2月11日
出海

消息稱小紅書香港辦公室正在籌備中，將與阿里為鄰

近日，據香港《星島日報》報道，小紅書正在洽租銅鑼灣時代廣場的高層單位，涉及樓面約7000方尺，預計短期內將完成租賃。這一舉措意味著小紅書將正式設立香港區辦公室，為其在香港的業務拓展…

聆聽
2025年2月10日
新聞

Meta計劃下周全公司裁員，同時加速招聘機器學習工程師

據路透社報道，Facebook母公司Meta Platforms計劃下周在全公司范圍內進行裁員，同時加快招聘機器學習工程師的步伐。據悉，Meta裁員通知將從當地時間周一上午5點開…

李小白
2025年2月8日
新聞

傳聞阿里計劃投資10億美元，認購DeepSeek 10%股權

據傳，阿里巴巴集團近期計劃對近期爆火的DeepSeek公司（DS）進行一筆重大投資。按照該計劃，阿里將以100億美元的估值，投入10億美元，旨在認購DeepSeek公司10%的股權…

NEWS
2025年2月7日
商業

Meta股價12連漲，扎克伯格財富暴增

當地時間周二，Meta股價延續創紀錄的連漲勢頭，實現連續12個交易日收漲。受投資者對其人工智能發展前景熱情高漲的影響，Meta股價今年以來漲幅超17%。在這12個交易日里，Meta…

李小白
2025年2月6日
新聞

原菜鳥CFO劉政加盟螞蟻集團，負責集團財務管理工作

昨日，螞蟻集團候任 CEO、總裁韓歆毅通過內部郵件宣布，原菜鳥集團 CFO 劉政已加入螞蟻集團，即日起擔任螞蟻集團 CFO，全面負責集團財務管理工作，并向韓歆毅匯報。劉政擁有豐富…

校草
2025年2月6日
新聞

Meta深陷泄密困擾：嚴厲警告與內部調整并行

近日，Meta公司因內部會議內容頻繁泄露，引發高層強烈不滿，公司創始人馬克·扎克伯格尤為厭煩。為遏制這一現象，Meta發布備忘錄，嚴正警告員工，泄露內部信息將面臨失業風險。然而尷尬…

檸萌
2025年2月4日
產品

Meta x雷朋智能眼鏡全球銷量破百萬，計劃進一步擴大市場

在昨日的財報電話會議上，Meta公司CEO扎克伯格透露，與雷朋合作推出的Meta X智能眼鏡全球銷量已突破100萬副，并計劃在今年將銷量提升至200萬副，后續更是瞄準了500萬副的…

校草
2025年2月1日
商業

Meta發布2024財年Q4及全年財報，業績超預期

今日，Meta發布了截至2024年12月31日的第四季度及全年未經審計財報。財報顯示，Meta第四季度營收達到483.85億美元，同比增長21%，超出分析師預期；凈利潤為208.3…

小科同學
2025年1月30日
AI

DeepSeek R1模型震驚硅谷，開源AI再顯威力

近日，中國人工智能公司DeepSeek發布的R1模型在硅谷引起了巨大轟動。據第三方基準測試顯示，該模型在性能上超越了包括OpenAI、Meta和Anthropic在內的多家美國領先…

AI
2025年1月27日
AI

Meta將繼續大力投資AI 扎克伯格已宣布今年資本支出將超過600億美元

Meta、谷歌等加大AI投入，Meta去年初采購35萬塊GPU花費超100億美元，CEO扎克伯格宣布今年資本支出600-650億美元，大幅擴大AI團隊，計劃上線1GW算力，年底擁有超130萬塊GPU。

科技探索者
2025年1月26日
出海

阿里巴巴國際站GMV同比增長30%，拉美市場需求強勁

近日，阿里巴巴國際站公布了其2024年12月以來的最新交易數據。數據顯示，該平臺總商品交易額（GMV）同比增長達到了30%，顯示出強勁的市場增長勢頭。在各市場中，歐洲市場的增速尤…

小丸子
2025年1月23日
新聞

Meta推出“突破獎金計劃”，吸引TikTok創作者轉投旗下平臺

在特朗普政府對TikTok發出“不賣就禁”的法令，并給予75天寬限期的背景下，社交媒體巨頭Meta看到了搶占市場的良機。據報道，Meta旗下的Facebook和Instagram（…

校草
2025年1月23日
新聞

Instagram砸重金吸引創作者，推出Reels獎金計劃以抗衡TikTok

Instagram發獎金吸引創作者在Reels首發短視頻，金額1萬至5萬美元不等，并推“突破性獎金計劃”爭搶TikTok創作者，旨在擴大短視頻市場份額，與TikTok競爭。

蘋果派
2025年1月23日
新聞

歐盟：Meta、谷歌、TikTok等承諾，將加大力度打擊非法仇恨言論

近日，歐盟傳來消息，Meta、谷歌、TikTok及X等互聯網巨頭已向歐洲立法機構作出莊嚴承諾，將采取更為嚴厲的措施，以有效遏制并清除其平臺上的非法仇恨言論。這一承諾被正式納入歐盟最…

NEWS
2025年1月23日

發表回復

登錄后才能評論

阿里巴巴開源Qwen1.5-110B模型，性能比肩Meta-Llama3-70B

相關推薦

發表回復