英偉達(dá)推出高效小語(yǔ)言AI模型Mistral-NeMo-Minitron 8B

好奇寶寶 ? 2024年8月23日 17:22:00 ? 新聞

全球領(lǐng)先的圖形處理器（GPU）制造商英偉達(dá)公司近日宣布了一項(xiàng)重要進(jìn)展，成功發(fā)布了名為Mistral-NeMo-Minitron 8B的小型語(yǔ)言AI模型。這款模型以其高精度和高計(jì)算效率為特點(diǎn)，標(biāo)志著AI技術(shù)在資源有限環(huán)境下的應(yīng)用邁出了重要一步。

據(jù)英偉達(dá)官方介紹，Mistral-NeMo-Minitron 8B模型擁有80億個(gè)參數(shù)，是英偉達(dá)在之前與Mistral AI合作推出的120億參數(shù)Mistral NeMo 12B模型基礎(chǔ)上，通過(guò)先進(jìn)的寬度剪枝（width-pruning）和知識(shí)蒸餾（knowledge distillation）技術(shù)優(yōu)化而來(lái)。這一成果不僅展示了英偉達(dá)在AI模型壓縮和加速領(lǐng)域的深厚實(shí)力，也為AI技術(shù)在更廣泛場(chǎng)景下的應(yīng)用提供了可能。

寬度剪枝技術(shù)通過(guò)去除對(duì)模型準(zhǔn)確率貢獻(xiàn)最小的權(quán)重，有效減小了神經(jīng)網(wǎng)絡(luò)的規(guī)模。而知識(shí)蒸餾則通過(guò)在一個(gè)小型數(shù)據(jù)集上重新訓(xùn)練剪枝后的模型，顯著提升了其因剪枝而降低的準(zhǔn)確率。英偉達(dá)在《Compact Language Models via Pruning and Knowledge Distillation》論文中詳細(xì)闡述了這一創(chuàng)新過(guò)程，為業(yè)界提供了寶貴的參考。

在性能表現(xiàn)上，Mistral-NeMo-Minitron 8B模型展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。在包括語(yǔ)言理解、常識(shí)推理、數(shù)學(xué)推理、總結(jié)、編碼以及生成真實(shí)答案在內(nèi)的九項(xiàng)流行基準(zhǔn)測(cè)試中，該模型均取得了優(yōu)異的成績(jī)，遙遙領(lǐng)先于其他同類(lèi)模型。這一結(jié)果充分證明了Mistral-NeMo-Minitron 8B模型在保持高精度的同時(shí)，也具備了極高的計(jì)算效率。

尤為值得一提的是，Mistral-NeMo-Minitron 8B模型可以在搭載英偉達(dá)RTX顯卡的工作站上運(yùn)行，這意味著用戶(hù)無(wú)需投入高昂的成本即可享受到AI技術(shù)帶來(lái)的便利。這一特性無(wú)疑將極大地推動(dòng)AI技術(shù)在中小企業(yè)、科研機(jī)構(gòu)以及個(gè)人用戶(hù)中的普及和應(yīng)用。

英偉達(dá)此次發(fā)布的Mistral-NeMo-Minitron 8B模型，不僅是對(duì)現(xiàn)有AI技術(shù)的一次重要突破，更是對(duì)未來(lái)AI發(fā)展趨勢(shì)的一次有力探索。隨著技術(shù)的不斷進(jìn)步和應(yīng)用的不斷拓展，我們有理由相信AI技術(shù)將在更多領(lǐng)域發(fā)揮出更大的作用和價(jià)值。

原創(chuàng)文章，作者：好奇寶寶，如若轉(zhuǎn)載，請(qǐng)注明出處：http://www.bdzhitong.com/article/675780.html

AI GPU Mistral-NeMo-Minitron 8B 英偉達(dá)

好奇寶寶認(rèn)證作者

0 0

AI

?DeepSeek R2模型加速來(lái)襲，五月前有望提前亮相

近日，據(jù)路透社報(bào)道，AI初創(chuàng)公司DeepSeek正在加速推進(jìn)其R2人工智能模型的發(fā)布進(jìn)程。據(jù)悉，該模型原本計(jì)劃在五月正式推出，但目前DeepSeek方面正在努力加快這一步伐，以期盡…

AI
19小時(shí)前
新聞

新加坡最大銀行星展集團(tuán)裁員：未來(lái)三年預(yù)計(jì)裁員4000人

新加坡最大的銀行——星展銀行（DBS）近日宣布了一項(xiàng)重大人事調(diào)整計(jì)劃。由于人工智能（AI）技術(shù)的不斷進(jìn)步，該銀行預(yù)計(jì)未來(lái)三年內(nèi)將裁減約4000名臨時(shí)員工和合同工?。據(jù)銀行發(fā)言人表…

檸萌
23小時(shí)前
AI

消息稱(chēng)?即夢(mèng)AI視頻生成平臺(tái)考慮接入DeepSeek

近日，有媒體報(bào)道稱(chēng)，字節(jié)跳動(dòng)AI視頻生成產(chǎn)品“即夢(mèng)”正在考慮接入爆火的DeepSeek技術(shù)，以進(jìn)一步提升其視頻生成能力。這一聯(lián)動(dòng)玩法將為用戶(hù)帶來(lái)更加精細(xì)的視頻創(chuàng)作體驗(yàn)，例如，用戶(hù)可…

AI
1天前
AI

?消息稱(chēng)字節(jié)跳動(dòng)豆包內(nèi)測(cè)自研深度思考模型，思維鏈功能初現(xiàn)端倪

今日，有網(wǎng)友驚喜地發(fā)現(xiàn)，字節(jié)跳動(dòng)旗下的AI助手豆包正在小范圍測(cè)試一項(xiàng)全新的深度思考模型。不過(guò)，令人意外的是，這次測(cè)試并未接入外界熱議的DeepSeek模型，而是采用了字節(jié)跳動(dòng)自研的…

AI
1天前
商業(yè)

英偉達(dá)財(cái)報(bào)發(fā)布時(shí)間公布，DeepSeek沖擊后股價(jià)能否再創(chuàng)新高？

全球AI龍頭英偉達(dá)公司將于美國(guó)時(shí)間2月26日公布其最新一季的財(cái)報(bào)。近期，隨著英偉達(dá)股價(jià)在DeepSeek的沖擊后逐漸站穩(wěn)，不少投資機(jī)構(gòu)如摩根士丹利證券、瑞銀證券和凱基投顧等紛紛加入…

商業(yè)頭條
1天前
AI

DeepSeek-R1成Hugging Face最受歡迎大模型，超其他150萬(wàn)模型

今日，AI大模型社區(qū)Hugging Face的聯(lián)合創(chuàng)始人兼CEO Clement Delangue宣布，中國(guó)開(kāi)源大模型DeepSeek-R1在Hugging Face平臺(tái)上獲得了超…

AI
2天前
AI

?傳音Infinix手機(jī)迎來(lái)AI新升級(jí)：DeepSeek-R1滿(mǎn)血版來(lái)襲

近日，傳音控股旗下的Infinix品牌宣布正式接入DeepSeek-R1滿(mǎn)血版AI技術(shù)。據(jù)悉，從2月26日起，支持XOS 14.5及以上版本的Infinix手機(jī)用戶(hù)，將能夠通過(guò)系統(tǒng)…

野游栗
3天前
新聞

英偉達(dá)黃仁勛首公開(kāi)回應(yīng)DeepSeek爆火：投資存在誤解

今年1月底，DeepSeek發(fā)布的R1模型在科技圈掀起軒然大波，導(dǎo)致英偉達(dá)股價(jià)暴跌16.79%，市值瞬間蒸發(fā)5900億美元，創(chuàng)下美國(guó)金融史新紀(jì)錄。面對(duì)這一風(fēng)暴，英偉達(dá)CEO黃仁勛首…

秋秋
4天前
商業(yè)

?DeepSeek官方辟謠：首次融資傳聞不實(shí)

近日，市場(chǎng)上流傳著DeepSeek正考慮首次融資的傳聞。然而，從知情人士處獲悉，這一信息并不屬實(shí)，“融資相關(guān)均為謠言”。 DeepSeek，這家在AI領(lǐng)域迅速崛起的公司，憑借其低成…

AI
6天前
AI

騰訊微信AI搜索正式灰度測(cè)試接入DeepSeek-R1滿(mǎn)血版

近日，騰訊方面?zhèn)鱽?lái)重磅消息，微信AI搜索正式灰度測(cè)試接入DeepSeek-R1滿(mǎn)血版模型，為用戶(hù)帶來(lái)更加多元化的搜索體驗(yàn)。這一消息迅速引發(fā)市場(chǎng)關(guān)注，騰訊云概念股競(jìng)價(jià)批量漲停，展現(xiàn)出…

AI
2025年2月18日
新聞

Spotify 將推出“Music Pro”訂閱會(huì)員，每月額外收取最高5.99美元

近日，據(jù)彭博社報(bào)道，音樂(lè)流媒體巨頭 Spotify 即將推出一款全新的訂閱會(huì)員等級(jí)——“Music Pro”。這款訂閱計(jì)劃將在現(xiàn)有套餐的基礎(chǔ)上，每月額外收取最高5.99美元（約43…

NEWS
2025年2月18日
新聞

消息稱(chēng)谷歌AI老將吳永輝轉(zhuǎn)戰(zhàn)字節(jié)跳動(dòng)，領(lǐng)軍大模型基礎(chǔ)研究新方向

據(jù)多方消息證實(shí)，在谷歌任職17年的頂尖AI專(zhuān)家吳永輝博士已正式加入字節(jié)跳動(dòng)，擔(dān)任大模型團(tuán)隊(duì)Seed基礎(chǔ)研究負(fù)責(zé)人，專(zhuān)注于大模型基礎(chǔ)技術(shù)探索及“AI for Science”等長(zhǎng)期科…

NEWS
2025年2月18日
新聞

亞馬遜Alexa升級(jí)版遇阻：AI答不準(zhǔn)，上線推遲至三月

亞馬遜原定于2月26日展示的生成式AI升級(jí)版Alexa語(yǔ)音助手，因測(cè)試中出現(xiàn)“回答不準(zhǔn)確”問(wèn)題，正式上線時(shí)間將推遲至3月31日或更晚。據(jù)《華盛頓郵報(bào)》報(bào)道，新版Alexa原計(jì)劃以免…

校草
2025年2月16日
AI

谷歌Gemini免費(fèi)版開(kāi)放文件分析代碼文檔都能傳

谷歌今日宣布，旗下AI助手Gemini即日起向所有免費(fèi)用戶(hù)開(kāi)放文件上傳及分析功能，此前該服務(wù)僅限每月19.99美元（約145元人民幣）訂閱的Gemini Advanced用戶(hù)使用。…

Google
2025年2月15日
商業(yè)

英偉達(dá)市值一夜大增超6300億元，AI芯片巨頭創(chuàng)美股奇跡

當(dāng)?shù)貢r(shí)間2月14日，英偉達(dá)（NVIDIA）在美股市場(chǎng)迎來(lái)歷史性時(shí)刻：英偉達(dá)股價(jià)單日暴漲超7%，英偉達(dá)市值激增約6300億元人民幣，總市值突破12萬(wàn)億元人民幣，刷新全球科技股單日增值…

商業(yè)頭條
2025年2月15日
AI

谷歌DeepMind發(fā)布WebLI-100B，增強(qiáng)文化多樣性和多語(yǔ)言性

據(jù)知名科技媒體MarkTechPost報(bào)道，昨日，谷歌DeepMind團(tuán)隊(duì)正式發(fā)布了名為WebLI-100B的千億級(jí)數(shù)據(jù)集。據(jù)悉，WebLI-100B數(shù)據(jù)集包含了驚人的1000億個(gè)…

Google
2025年2月14日
AI

官宣：百度文心大模型4.5系列將于6月30日起正式開(kāi)源

今日，百度官方宣布：未來(lái)幾個(gè)月，百度將陸續(xù)推出全新的文心大模型4.5系列，并在6月30日正式向公眾開(kāi)源。這一消息無(wú)疑為人工智能領(lǐng)域注入了新的活力。據(jù)了解，百度文心大模型作為百度在…

百度
2025年2月14日
AI

OpenAI CEO阿爾特曼：AI成本驟降，每年成本降至十分之一

近日，OpenAI的首席執(zhí)行官山姆·阿爾特曼（Sam Altman）在一篇博文中，揭示了人工智能發(fā)展的迅猛勢(shì)頭及其對(duì)社會(huì)經(jīng)濟(jì)的深遠(yuǎn)影響。阿爾特曼指出，AI模型的智能程度與其訓(xùn)練和…

AI
2025年2月12日
AI

DeepSeek vs ChatGPT：哪款A(yù)I工具更適合你？

在AI技術(shù)日新月異的今天，DeepSeek和ChatGPT兩款A(yù)I工具成為了市場(chǎng)上的熱門(mén)選擇。它們各有千秋，為了幫助大家根據(jù)需求做出明智的選擇，我們來(lái)進(jìn)行一次詳細(xì)的DeepSeek…

若安丶
2025年2月11日
新聞

DeepMind CEO盛贊中國(guó)AI公司Deepseek，AGI或5年內(nèi)問(wèn)世

近日，谷歌旗下DeepMind公司的首席執(zhí)行官德米斯·哈薩比斯對(duì)中國(guó)的AI公司Deepseek給予了高度評(píng)價(jià)。哈薩比斯表示，Deepseek的AI模型可能是他見(jiàn)過(guò)的來(lái)自中國(guó)的最佳作…

野游栗
2025年2月10日

發(fā)表回復(fù)

登錄后才能評(píng)論

英偉達(dá)推出高效小語(yǔ)言AI模型Mistral-NeMo-Minitron 8B

相關(guān)推薦

發(fā)表回復(fù)