專注數字內容風控，網易易盾安全大模型正式亮相

陳晨 ? 2024年7月11日 16:44:58 ? 產經

7月6日，以“智見未來，護航AI”為主題的2024網易易盾AI數字內容風控大會在杭州順利舉行。會上，網易數智旗下網易易盾正式發布面向數字內容風控領域的安全大模型。

“安全是一個需要抬頭創新、低頭深耕的行業。數字內容風控這個網絡安全領域內的細分賽道正在蓬勃發展，這次安全大模型的發布是我們多年來技術和經驗沉淀的‘集大成時刻’。”網易數智副總經理、網易易盾總經理朱浩齊在大會上帶來網易易盾自研安全大模型的首次正式亮相。

七年磨一劍：為安全范式轉變做準備

在社會學著作《理解媒介》中，思想家麥克盧漢曾深刻、具體地揭示了媒介的影響力。

按照麥克盧漢的理論，媒介信息在很大程度上影響人間事物的尺度變化和模式變化，塑造人的組合方式和形態。因此，媒體是導致社會變動的最強大力量之一。從報紙到電視廣播，再到網絡傳媒與數字時代的新媒體，作為信息和內容的載體，媒介方式隨著技術變革在不斷進化。與此同時，麥克盧漢的理論在逐步得到證實。

數字內容的安全問題不僅沒有隨著技術進步消除，相反，對社會的影響正在逐年上升。

“我們在經歷一場底層安全范式的轉變。信息傳播技術的進步把內容安全問題的重要性升級了，需求端從原先的附加安全發生了到內生安全這一模式轉變。作為服務者，我們不僅需要從理論、技術和工具上做準備，更需要從思維上主動擁抱變革。”朱浩齊在大會上說。

如今，人工智能技術的發展與應用極大地提升了內容生產的效率和質量。通過自然語言處理（NLP）、機器學習、圖像識別等技術，人工智能可以幫助企業自動化地生成文章、視頻、圖像等內容，甚至進行個性化推薦和優化，滿足用戶的多樣化需求。誠然，AIGC為企業與社會帶來內容生產力的成倍增長，但也再次放大數字內容安全的重要性。

從最開始服務于網易內部業務的安全部門到服務外部客戶的完全商業化品牌，網易易盾既有天然的技術優勢，又有豐富的的場景實踐經驗。

同時，多年內外部客戶的持續服務也讓網易易盾擁有了成熟的技術、產品與服務體系。網易易盾面向娛樂社交、游戲、電商、金融、零售、政企等多個行業相繼推出了解決方案，同時秉持“助力客戶內生成長”的服務理念，持續上線AIGC內容安全、出海安全合規、未成年人網絡保護等數十個場景化安全方案。

7年多的時間，網易易盾累計數據檢測量超3萬億，覆蓋終端數超32億，服務客戶審核效率提升超10倍。

網易易盾既是數字內容風控領域的頭部企業，又是AI時代的先行者。率先參與到從附加安全到內生安全的轉變，并以AI技術為安全業務賦能，給客戶提供更加專業的安全產品和服務，進而推動行業發展——這在網易易盾總經理朱浩齊看來，是義不容辭的責任，也是得天獨厚的市場先機。

因此，更懂數字內容風控的安全大模型正式發布了。

安全大模型：聚焦數字內容風控

在數字內容安全問題治理的過程中，過去很長一段時間，更多的是憑借經驗。

在抖音上這句話能不能發？在小紅書上這個問題能不能搜到？在微博這個話題是否可以討論？然而落到個體對每次具體情況的理解不同，最終體現在安全風控措施的理解上也非常不同。

在網易易盾成立的初期，曾有過一次深入的討論：我們能不能基于我們對各行業實際落地的經驗，去建立各行業內容風控的標準？而在實際落地過程中，發現標準仍還是非常的粗糙，與以往并沒有根本性不同。

大模型的興起和應用，使網易易盾這個想法真正具備可行性。早在2021年，網易易盾就開始著手研究大模型相關技術，通過讓大模型學習理解不同場景下，不同內容的評判結果，讓人工智能去建立各行各業、各個場景中內容風控的研判標準，進而完成數字內容的精細化治理。

在這樣復雜的特定場景中，通用大模型顯然并不能提供符合需求的最優解。

“數字內容風控是安全服務。安全，就要一絲一毫都不能差。我們給客戶提供的必須是我們自己都挑不出問題的完美方案。”朱浩齊講述了帶領團隊開發安全垂直大模型時的原則和思路。

在大模型的“軍備競賽”中，網易易盾雖然有“行業領軍者”的自我要求，卻不急于將不夠完美的產品推向客戶。基于自身業務的特性，從客戶的需求和實際應用場景出發，再到小心翼翼地驗證產品的每一個功能細節，直到反復確認沒有問題，可以解決客戶的問題——網易易盾的大模型之路走的每一步都是穩字當先。

應用安全大模型的數字內容風控通過大模型對風控尺度的理解，對風險內容實現標簽的自動、精準標識，提升人工審核效率。目前，基于各種場景的測試情況，網易易盾安全大模型已經做到對部分色情疑難樣本召回提升30%以上，助力廣告對抗場景下的違法廣告識別率達到97%以上，AIGC人臉風格化疑難案例的識別率超90%。此外，該安全大模型將風險對抗的時效提升到了小時級，并且輔助真人引流團伙檢出量增長達3倍。

同時，在結合了網易易盾安全大模型的通用大模型問答場景中，基于安全大模型對用戶輸入的語義理解和對風控規則的理解，能夠幫助各類通用大模型對于一些“看上去不好答”的題目，給予準確的回答。除少數幾個極度敏感的議題外，幫助提供開放式問答的模型能夠快速做到“應答盡答”。

以“?！敝巍澳！保篈I時代的長遠藍圖

生成式人工智能的發展始終伴隨著對安全的質疑。

自ChatGPT引爆人工智能浪潮熱點后，世界各國紛紛緊急將生成式人工智能的安全管控上升至重要緊急議題。我國為了促進生成式人工智能健康發展和規范應用，發布《生成式人工智能服務管理暫行辦法》，歐盟理事會批準全球首部對人工智能進行全面監管的《人工智能法案》，美國發布一項名為關于安全、可靠和值得信賴的人工智能（AI）的相關行政令。

綜合世界各國政府部門與頂級智庫對于人工智能安全問題的判斷來看，大模型時代的安全面臨突出的問題在于數據安全、內容安全，其中包括業務安全、供應鏈安全、合規以及道德倫理風險。

其中，在當下以及未來很長一段時間內，內容安全問題會一直是人工智能治理的關鍵挑戰。社會需要關注的是大模型生成，如AI換臉的虛假違規內容被利用為作惡工具，以及幻覺問題、知識模糊、不實新聞等。

“對人工智能的治理，長期來看，也許需要靠另一個人工智能了?！敝旌讫R表達了對AI時代內容安全問題治理趨勢的判斷，“人工智能給數字內容生產和傳播效率帶來的是幾何倍數級別的增長，對于安全治理的能力提升要求自然也只有人工智能才能滿足。”

安全，不是一朝一夕的事情。尤其是全新技術帶來的既有“已知的未知”安全問題，也有“未知的未知”安全問題。為了解決各種“已知的未知”和“未知的未知”安全問題，網易易盾在大模型的研發思路中應用了新設計的防御理論：內生的彈性縱深防御體系。這個體系中有兩個最重要的設計原則：

一是用時間換精度。這個原則中考慮的并非某個時間點下系統的靜態防御能力，而是需要評估在持續的攻擊之下系統的自我升級能力，其稱之為“自免疫力”。

二是用不確定性提升防御強度。在測試數據變化的情況下，該原則要求通過提升自我保護能力實現系統對多次攻擊的穩定防御。

用大模型治理大模型的數字內容安全，用人工智能對抗人工智能帶來的安全風險。這是網易易盾對未來趨勢的判斷，也是網易易盾正在走的安全技術長征。

本文轉載自：，不代表科技訊之立場。原文鏈接：http://show.wolaioa.com.cn/preview/n3oRnAtLqWyL2Fv02bLgpg.html

陳晨管理團隊

0 0

產經

三星AI神生活家電驚艷亮相AWE 2025，創新科技重塑理想家居生活

3月20日至23日，三星攜眾多前沿產品與創新技術亮相AWE 2025，在逾1500㎡的超大展示空間內上演了一場科技與生活深度融合的盛宴。在其精心打造的展區中，生活家電技術大放異彩，…

陳晨
10分鐘前
產經

打造家庭放映廳海信激光電視探索X1亮相AWE 2025

3月20日，2025中國家電及消費電子博覽會（AWE）在上海新國際博覽中心拉開帷幕。海信以“AI YOUR LIFE”為主題，展示了在全場景AI生態下的最新創新成果，包括全球首款1…

陳晨
12分鐘前
產經

斬獲AWE 2025艾普蘭獎！海信激光電視探索X1打造家庭觀影新體驗

3月20日，中國家電及消費電子博覽會（AWE 2025）在上海新國際博覽中心拉開大幕。作為全球激光顯示領域的領軍企業，海信攜行業首發1000nits全屏亮度激光電視探索X1驚艷亮相…

陳晨
13分鐘前
TCL實業攜多款創新新品亮相AWE 2025，全面展現智慧科技硬實力

2025年3月20日，中國家電及消費電子博覽會（AWE 2025）在上海盛大啟幕。作為全球三大家電及消費電子展之一，AWE 2025匯聚了眾多國內外的頂尖科技產品和前沿創新理念。作…

陳晨
產經 14分鐘前
產經

行業首個！天貓推出AI設計工具商家可一鍵生成媲美實拍場景圖

天貓率先給商家配備“AI設計助手”，可一鍵生成媲美實拍的場景圖！3月20日，在上海AWE2025展上，天貓推出的電商行業首款AI 設計工具“家作”全新升級。商家上傳商品圖，即可一鍵…

陳晨
16分鐘前
產經

全球顯示產業盛會DIC 2025新聞發布會于深圳召開

3月20日，由中國光學光電子行業協會液晶分會（CODA）主辦的中國（上海）國際顯示產業高峰論壇暨國際（上海）顯示技術及應用創新展（DIC 2025）新聞發布會在深圳星河麗思卡爾頓酒…

陳晨
16分鐘前
產經

小牛電動跨界《和平精英》，「小牛杯」競速賽引領品牌年輕化浪潮

3月21日，全球高端智能電動車領導品牌小牛電動與全球熱門游戲《和平精英》攜手推出的「小牛杯」競速賽正式上線，游戲中的同款競速載具——2025款NX Pro也同日發售。此次合作不僅是…

陳晨
18分鐘前
產經

未來智能現身AWE 2025：訊飛AI會議耳機引領智能辦公新體驗

3月20至23日，全球三大家電及消費電子博覽會之一——AWE 2025在上海隆重啟幕。本屆AWE展會以“AI科技、AI生活”為主題，通過13個展館、15萬平方米的展區，場景化展示了…

陳晨
18分鐘前
產經

洗澡還能“定溫”？海爾熱水器憑獨創恒溫科技獲艾普蘭獎

　　開車時可以定速巡航，輕松又省力，但你有沒有想過，洗澡時熱水也能“定溫”巡航？3月20日，在中國家電及消費電子博覽會（AWE2025）現場，海爾熱水器攜多款重磅產品亮相。其中搭載…

若安丶
24分鐘前
產經

全產業鏈碾壓：從鏡頭到客廳，索尼如何實現”色彩霸權”？

作為家電行業的技術風向的AWE（中國家電及消費電子博覽會），每一年都會給予觀眾一場技術盛宴。而今年作為期待值較高的展臺之一，索尼今年更像是對未來家庭影院進行了一次預演。從下一代顯示…

陳晨
3小時前
產經

HUAWEI Pura X正式發布，華為云空間帶來安全便捷體驗

華為Pura先鋒盛典及鴻蒙智行新品發布會上，華為首款全面搭載HarmonyOS 5的手機HUAWEI Pura X正式發布，華為云空間正式升級為系統級數據資產管理服務，不…

陳晨
3小時前
產經

三原色獨立控光的終極形態：解碼索尼RGB高密度LED顯示系統技術壁壘

2025年3月20日，在中國家電及消費電子博覽會（AWE2025）上，索尼重磅發布了RGB高密度LED背光系統。這一新一代顯示技術不同于當前市場上普遍采用的白光LED背光方案，憑借…

陳晨
3小時前
產經

華大北斗芯耀紐倫堡嵌入式展EW2025

德國當地時間3月11日，全球嵌入式系統領域的風向標盛會“德國紐倫堡嵌入式展覽會”（Embedded World 2025，以下簡稱EW2025）在德國紐倫堡會展中心盛大啟幕。作為全…

陳晨
3小時前
產經

2025AWE 艾普蘭獎揭曉三星AI神系列產品再獲殊榮以實力詮釋創新力量

3月20日，享有全球智慧生活領域“奧斯卡”盛譽的2025中國家電及消費電子博覽會（AWE 2025）艾普蘭獎頒獎典禮在上海隆重舉行。作為家電與消費電子行業的權威標桿，艾普蘭獎以其無…

陳晨
3小時前
產經

連續十年國內銷售冠軍科沃斯，在AWE發布新地寶X9系列

（上海，2025 年 3 月 20 日）中國掃地機器人市場連續10年規模第一的服務機器人品牌，科沃斯機器人攜全場景智慧清潔解決方案亮相 AWE2025（中國家電及消費電子博覽會）?！?/p>

陳晨
3小時前
產經

從電裝誕生，QR二維碼驅動數字化變革，邁向未來30年

在當今社會，從智能手機的無現金支付到餐廳的桌面點餐系統，QR二維碼已成為提升生活便利性的重要支撐技術。自1994年誕生以來，這項技術不斷演進，應用場景持續拓展，推動了數字化社會的加…

陳晨
3小時前
產經

助力美好生活愿景三星AI神系列產品持續賦能智慧家居新體驗

隨著2025中國家電及消費電子博覽會（AWE 2025）盛大啟幕，AI技術在家電與消費電子領域的深度應用引起廣泛關注。作為家電行業的創新引領者，三星生活家電攜AI神冰箱、AI神 …

陳晨
3小時前
產經

HUAWEI Pura X推出每日早報服務，闊感瀏覽沉浸自如

3月20日，華為正式發布HUAWEI Pura X 闊折疊。作為華為首款全面搭載HarmonyOS 5的科技新物種，為內容而生。HUAWEI Pura…

陳晨
4小時前
產經

更沉浸、更智能、更具儀式感！華為Pura X上的鴻蒙版QQ音樂“大有不同”

2025年3月20日，在華為Pura先鋒盛典及鴻蒙智行新品發布會上，華為推出首款搭載HarmonyOS 5（鴻蒙操作系統5）的手機HUAWEI Pura X，標志著華為終端全面進入…

陳晨
4小時前
產經

天生出色，問界新M5 Ultra正式上市，售價22.98萬元起

2025年3月20日，華為Pura先鋒盛典及鴻蒙智行新品發布會，問界新M5 Ultra正式上市，建議零售價22.98萬元起，至高可享30800元購車權益。問界新M5 Ultra定位…

陳晨
4小時前

發表回復

登錄后才能評論

專注數字內容風控，網易易盾安全大模型正式亮相

相關推薦

發表回復

專注數字內容風控，網易易盾安全大模型正式亮相