月之暗面Kimi開源Moonlight大模型：訓練效率翻倍，技術細節全公開

AI ? 1天前 ? AI

昨日，月之暗面Kimi發布《Muon可擴展用于LLM訓練》技術報告，正式推出基于Muon優化器訓練的混合專家模型Moonlight。該模型提供30億和160億參數兩個版本，通過5.7萬億token訓練數據，在更低浮點運算量（FLOPs）下實現性能突破，顯著提升帕累托效率邊界?。
Moonlight-16B-A3B作為核心測試模型，總參數量15.29億，激活參數2.24億。其采用的Muon優化器通過權重衰減策略和參數更新幅度調整技術，將訓練效率提升至AdamW優化器的2倍，且無需復雜超參數調優?。團隊開發的分布式Muon版本優化了內存使用和通信效率，已在GitHub開源?。
此次開源內容包含預訓練模型、指令微調模型及訓練中間檢查點，覆蓋從算法到工程的全鏈條技術細節。Moonlight模型采用MIT許可證，允許商業用途，其激活參數僅需3億即可運行，大幅降低算力門檻?。
月之暗面此次發布正值大模型開源社區活躍期，其“訓練效率翻倍”的成果或將推動行業優化器技術迭代。Muon優化器的擴展性驗證和Moonlight模型的開源策略，已引發開發者社區廣泛討論?。

原創文章，作者：AI，如若轉載，請注明出處：http://www.bdzhitong.com/article/707652.html

AI認證作者

0 0

AI

月之暗面發布k1視覺思考模型，支持多領域圖像理解

今日，人工智能公司月之暗面宣布發布其最新的k1視覺思考模型。該模型基于強化學習技術，不僅在數學領域表現突出，還擴展到了物理、化學等基礎科學領域，展現出強大的圖像理解和思維鏈能力。 …

AI
2024年12月16日
AI

月之暗面出海遇阻：Kimi賺錢難題下新模型k0-math能否破局

近日，月之暗面創始人楊植麟，發布了一款名為k0-math的數學模型，主打深入思考。值得關注的是，其公司現在正面臨一個大問題：怎么賺錢？特別是他們的C端工具Kimi，雖然投放了不少廣…

AI
2024年11月27日
AI

Kimi探索版上線：AI自主搜索能力大幅提升，搜索量增10倍

今日，月之暗面正式發布了Kimi探索版，這款新版本在AI自主搜索能力上實現了重大突破。據官方介紹，Kimi探索版的搜索量相比普通版增強了10倍，一次搜索即可精讀500個頁面，為用戶…

AI
2024年10月11日
AI

月之暗面Kimi開放平臺推出上下文緩存公測，大幅降低長文本模型成本

今日，月之暗面正式對外宣布，其Kimi開放平臺上線了全新的上下文緩存（Context Caching）功能，并即日起開啟公測。這一創新技術旨在不增加API價格負擔的前提下，為開發者…

AI
2024年7月2日
商業

AI大模型公司月之暗面再獲投資，估值飆升至30億美元

在人工智能領域，一家名為月之暗面（Moonshot）的大模型公司正受到業界的廣泛關注。最新消息顯示，該公司的融資進程仍在持續進行，最新一輪的估值報價已達到驚人的30億美元（約合21…

商業頭條
2024年5月21日
AI

Kimi智能助手全新升級，新增多項AI輔助功能

近日，備受用戶青睞的Kimi智能助手宣布了其節后首次重大更新，推出了全新的Kimi+助手功能。該功能不僅為用戶提供了更為便捷的AI輔助服務，還在多個領域展現了強大的應用潛力，預示著…

AI
2024年5月7日
AI

創業公司Kimi大模型產品火爆出圈，能否持續引領AI新趨勢？

近日，一家僅成立一年的創業公司憑借一款效果出眾的大模型產品Kimi，在AI領域掀起了一股新的波瀾。這款面向C端用戶的智能助手以其獨特的長文本處理能力和多場景應用功能，贏得了市場的廣…

AI
2024年4月24日
AI

月之暗面Kimi智能助手升級，新增語音交互與搜索溯源功能

近日，月之暗面公司宣布旗下Kimi智能助手的基礎模型已更新至moonshot-v1-20240416版本，此次更新不僅提升了模型能力，還新增了多項實用功能，為用戶帶來更加便捷和智能…

AI
2024年4月19日
AI

國產AI大模型Kimi實現技術突破，領先海外產品

在人工智能領域，國產AI大模型Kimi近日宣布取得重大技術突破，將上下文無損輸入長度提升至200萬字，這一成就標志著國內大模型在部分能力上首次超越海外主流產品，成為業界的里程碑事件…

AI
2024年4月3日
AI

AI助手大比拼：Kimi vs GPT-4 vs Claude-3誰更勝一籌？

在數字化時代，AI助手已成為我們日常生活和工作中不可或缺的一部分。Kimi、GPT-4和Claude-3等AI助手各有特色，它們在處理不同任務時表現出不同的優勢和局限。本文將全面對…

AI
2024年4月2日
AI

突然火了！Kimi是什么？哪些AI+相關標的或受益？

3月20日，AI應用主線爆發。數據顯示，Sora概念、多模態AI、虛擬數字人等AI應用類板塊大漲，Kimi概念掀起漲停潮，其中華策影視、海天瑞聲“20CM”漲停。當日下午，“Ki…

百度
2024年3月29日
AI

Kimi Chat使用技巧：掌握這些步驟，讓智能聊天更順暢！

Kimi Chat是一款智能聊天機器人，可以提供各種信息和幫助。本文將介紹Kimi Chat使用技巧以及它的優點和缺點。一、Kimi Chat使用步驟打開Kimi Chat應用…

AI
2024年3月26日
AI

Kimi是什么？揭秘AI助手及其用途與用法

在人工智能技術的快速發展中，一款名為Kimi的智能助手近期引起了廣泛關注。Kimi智能助手憑借其強大的功能和便捷的用法，成為用戶在學術、工作、生活等多方面的得力助手。那么Kimi是…

AI
2024年3月26日
AI

Kimi大模型爆火每天獲客成本或超20萬元

目前Kimi投放廣告的獲客成本約在10元，如果算上拉新后用戶問答互動產生的算力成本，每個用戶的獲客成本達到12-13元

科技探索者
2024年3月26日
新聞

蘋果Apple從App Store下架熱門盜版電影應用 Kimi

近日，蘋果Apple公司從其官方應用商店App Store下架了一款名為Kimi的熱門應用。這款應用因其提供非法盜版電影內容而受到關注，其中包括了如《芭比娃娃》和《奧本海默》等熱門…

檸萌
2024年2月14日

發表回復

登錄后才能評論

月之暗面Kimi開源Moonlight大模型：訓練效率翻倍，技術細節全公開

相關推薦

發表回復