日韩欧美亚洲一区,亚洲一区二区精品,在线观看国精产品一区,蜜臀99久久精品久久久久小说

英偉達(dá)發(fā)布8B新AI 模型:精度、效率高,可在 RTX 工作站上運(yùn)行

英偉達(dá)于 8 月 21 日發(fā)布博文,發(fā)布了 Mistral-NeMo-Minitron 8B 小語(yǔ)言 AI 模型,具備精度高、計(jì)算效率高等優(yōu)點(diǎn),可在 GPU 加速的數(shù)據(jù)中心、云和工作站上運(yùn)行模型。

8 月 23 日消息,英偉達(dá)于 8 月 21 日發(fā)布博文,發(fā)布了 Mistral-NeMo-Minitron 8B 小語(yǔ)言 AI 模型,具備精度高、計(jì)算效率高等優(yōu)點(diǎn),可在 GPU 加速的數(shù)據(jù)中心、云和工作站上運(yùn)行模型。

英偉達(dá)發(fā)布8B新AI 模型:精度、效率高,可在 RTX 工作站上運(yùn)行

英偉達(dá)攜手 Mistral AI 上月發(fā)布開源 Mistral NeMo 12B 模型,在此基礎(chǔ)上英偉達(dá)再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 億個(gè)參數(shù),可以在搭載英偉達(dá) RTX 顯卡的工作站上運(yùn)行。

英偉達(dá)表示通過寬度剪枝(width-pruning)Mistral NeMo 12B,并知識(shí)蒸餾(knowledge distillation)輕度重新訓(xùn)練后獲得 Mistral-NeMo-Minitron 8B,相關(guān)成果發(fā)表在《Compact Language Models via Pruning and Knowledge Distillation》論文中。

剪枝通過去除對(duì)準(zhǔn)確率貢獻(xiàn)最小的模型權(quán)重來縮小神經(jīng)網(wǎng)絡(luò)。在 “蒸餾” 過程中,研究小組在一個(gè)小型數(shù)據(jù)集上重新訓(xùn)練剪枝后的模型,以顯著提高通過剪枝過程而降低的準(zhǔn)確率。

就其規(guī)模而言,Mistral-NeMo-Minitron 8B 在語(yǔ)言模型的九項(xiàng)流行基準(zhǔn)測(cè)試中遙遙領(lǐng)先。這些基準(zhǔn)涵蓋了各種任務(wù),包括語(yǔ)言理解、常識(shí)推理、數(shù)學(xué)推理、總結(jié)、編碼和生成真實(shí)答案的能力。

原創(chuàng)文章,作者:蘋果派,如若轉(zhuǎn)載,請(qǐng)注明出處:http://www.bdzhitong.com/article/675640.html

蘋果派的頭像蘋果派管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論
主站蜘蛛池模板: 民乐县| 太仓市| 克什克腾旗| 莎车县| 时尚| 石景山区| 双鸭山市| 遂溪县| 崇礼县| 石城县| 长岛县| 呼图壁县| 炎陵县| 台前县| 甘孜县| 阆中市| 定陶县| 龙游县| 乌恰县| 泰宁县| 吴忠市| 涿鹿县| 昌邑市| 舞阳县| 互助| 讷河市| 扶风县| 开鲁县| 邹城市| 博客| 雅安市| 洛南县| 玉龙| 东乡族自治县| 新蔡县| 噶尔县| 富锦市| 荆州市| 平邑县| 贺兰县| 巧家县|