DeepSeek推出NSA：超快速長上下文訓練與推理的新利器

AI ? 2025年2月18日 17:51:00 ? AI

今日，人工智能領域的創新企業DeepSeek宣布正式推出NSA（Native Sparse Attention）機制。這一機制專為超快速長上下文訓練與推理而設計，旨在通過硬件對齊和原生可訓練的稀疏注意力機制，為用戶帶來前所未有的體驗。

NSA的核心組件包括動態分層稀疏策略、粗粒度token壓縮以及細粒度token選擇。這些組件共同協作，使得NSA能夠在優化現代硬件設計的同時，實現推理加速和預訓練成本的降低，而且這一切都是在不犧牲性能的前提下完成的。

DeepSeek官方表示，NSA機制在通用基準、長上下文任務和基于指令的推理上，其表現與全注意力模型相當甚至更加優秀。這意味著，用戶在享受更快推理速度和更低成本的同時，也能獲得與頂尖模型相媲美的性能表現。

原創文章，作者：AI，如若轉載，請注明出處：http://www.bdzhitong.com/article/706746.html

DeepSeek NSADeepSeek

AI認證作者

0 0

AI

?DeepSeek R2模型加速來襲，五月前有望提前亮相

近日，據路透社報道，AI初創公司DeepSeek正在加速推進其R2人工智能模型的發布進程。據悉，該模型原本計劃在五月正式推出，但目前DeepSeek方面正在努力加快這一步伐，以期盡…

AI
12小時前
AI

消息稱?即夢AI視頻生成平臺考慮接入DeepSeek

近日，有媒體報道稱，字節跳動AI視頻生成產品“即夢”正在考慮接入爆火的DeepSeek技術，以進一步提升其視頻生成能力。這一聯動玩法將為用戶帶來更加精細的視頻創作體驗，例如，用戶可…

AI
17小時前
AI

?消息稱字節跳動豆包內測自研深度思考模型，思維鏈功能初現端倪

今日，有網友驚喜地發現，字節跳動旗下的AI助手豆包正在小范圍測試一項全新的深度思考模型。不過，令人意外的是，這次測試并未接入外界熱議的DeepSeek模型，而是采用了字節跳動自研的…

AI
1天前
新聞

?vivo正式上線滿血版DeepSeek-R1，藍心小V迎來AI大升級

vivo于今日（2月25日）正式宣布，滿血版DeepSeek-R1已正式上線，為用戶帶來“AI體驗再升級，藍心小V更智能高效”的全新感受。用戶只需將藍心小V升級至5.2.1.22版…

泡沫大盜
1天前
AI

?DeepSeek API充值服務重啟，調用價格有所調整

近日，DeepSeek API開放平臺傳來好消息，該平臺已重新開放API充值服務。此前，由于服務器資源緊張，DeepSeek一度暫停了API服務充值，給不少用戶帶來了不便。此次重啟…

AI
1天前
AI

?國家知識產權局重拳出擊，駁回63件DeepSeek惡意搶注商標

今日，國家知識產權局發布了一則重要通告，針對近期DeepSeek人工智能大模型在全球范圍內引發的廣泛關注，個別企業和自然人惡意搶注其商標的行為進行了嚴厲打擊?。據悉，這些惡意申請…

AI
1天前
商業

英偉達財報發布時間公布，DeepSeek沖擊后股價能否再創新高？

全球AI龍頭英偉達公司將于美國時間2月26日公布其最新一季的財報。近期，隨著英偉達股價在DeepSeek的沖擊后逐漸站穩，不少投資機構如摩根士丹利證券、瑞銀證券和凱基投顧等紛紛加入…

商業頭條
1天前
AI

?傳音Infinix手機迎來AI新升級：DeepSeek-R1滿血版來襲

近日，傳音控股旗下的Infinix品牌宣布正式接入DeepSeek-R1滿血版AI技術。據悉，從2月26日起，支持XOS 14.5及以上版本的Infinix手機用戶，將能夠通過系統…

野游栗
2天前
新聞

?小米超級小愛重新上線DeepSeek R1，開啟智能新體驗

近日，小米超級小愛再次迎來重大升級，重新上線了DeepSeek R1模型，并默認使用聯網搜索功能。用戶只需輸入“打開深度思考”，即可輕松開啟這一全新模式?。早在2月14日，小米澎…

XIAOMI
3天前
新聞

英偉達黃仁勛首公開回應DeepSeek爆火：投資存在誤解

今年1月底，DeepSeek發布的R1模型在科技圈掀起軒然大波，導致英偉達股價暴跌16.79%，市值瞬間蒸發5900億美元，創下美國金融史新紀錄。面對這一風暴，英偉達CEO黃仁勛首…

秋秋
4天前
AI

?DeepSeek官宣：下周陸續開源5個代碼庫，每日解鎖新進展

今日，DeepSeek官方宣布：接下來一周，公司將陸續開源5個代碼庫，每日都有新內容解鎖，旨在“毫無保留地分享我們微小但真誠的進展”。這一舉措無疑將為行業帶來新的活力和動力?。 D…

AI
5天前
商業

?DeepSeek官方辟謠：首次融資傳聞不實

近日，市場上流傳著DeepSeek正考慮首次融資的傳聞。然而，從知情人士處獲悉，這一信息并不屬實，“融資相關均為謠言”。 DeepSeek，這家在AI領域迅速崛起的公司，憑借其低成…

AI
6天前
商業

深度求索DeepSeek擬啟動首輪融資：阿里、中投或入局

據外媒The Information披露，中國人工智能明星企業深度求索（DeepSeek）正首次考慮引入外部投資。知情人士透露，阿里巴巴集團及主權財富基金中投公司均對此次融資表現出…

商業頭條
6天前
新聞

網易云音樂接入國產大模型DeepSeek-R1，帶來全新智能體驗

近日，網易云音樂宣布了一項重大更新，為創作者和用戶帶來了更加便捷和個性化的音樂服務。據了解，網易云音樂面向創作者研發的“音樂播客生成工具”與“對談播客生成工具”已經成功接入了國產開…

聆聽
2025年2月19日
AI

歐洲AI新勢力Mistral：歡迎DeepSeek新模型，共推開源發展

近日，據外媒報道，歐洲AI領域的佼佼者Mistral公司卻對DeepSeek新模型表示了熱烈歡迎。Mistral公司，被譽為“歐洲OpenAI”，其CEO亞瑟?曼什在接受《商業內幕…

AI
2025年2月19日
AI

DeepSeek服務器繁忙怎么辦？解決方法一覽

近期，DeepSeek爆火全球，但是隨著全球用戶的增加，用戶經常遇到DeepSeek服務器繁忙的問題，那么遇到DeepSeek服務器繁忙怎么辦呢？以下是一份詳細全面的攻略，旨在幫助…

AI
2025年2月19日
AI

騰訊微信AI搜索正式灰度測試接入DeepSeek-R1滿血版

近日，騰訊方面傳來重磅消息，微信AI搜索正式灰度測試接入DeepSeek-R1滿血版模型，為用戶帶來更加多元化的搜索體驗。這一消息迅速引發市場關注，騰訊云概念股競價批量漲停，展現出…

AI
2025年2月18日
新聞

百度搜索迎來新升級，DeepSeek深度搜索功能即將上線

近日，據華爾街見聞報道，百度搜索正在進行灰度測試，將接入全新的DeepSeek和文心一言深度搜索功能，為部分用戶帶來更加智能化的搜索體驗。據了解，百度方面已經宣布，預計將于2月1…

百度
2025年2月18日
AI

百度搜索重磅升級！免費接入DeepSeek大模型

昨日晚間，百度搜索宣布全面接入DeepSeek與文心大模型深度搜索功能。即日起，用戶可在搜索界面免費使用這兩項AI技術，享受多模態輸入、專業級內容回復及跨場景任務處理能力，文心智能…

百度
2025年2月17日
新聞

微信接入DeepSeek 騰訊回應：多個產品正在探索接入DeepSeek

近日，微信用戶迎來全新搜索體驗。有記者發現，微信搜一搜功能已開始灰度測試接入國內知名大模型DeepSeek-R1。部分用戶在對話框頂部搜索入口發現新增的”AI搜索&#8…

NEWS
2025年2月17日

發表回復

登錄后才能評論

DeepSeek推出NSA：超快速長上下文訓練與推理的新利器

相關推薦

發表回復