日韩欧美亚洲一区,亚洲一区二区精品,在线观看国精产品一区,蜜臀99久久精品久久久久小说

專注數字內容風控,網易易盾安全大模型正式亮相


7月6日,以“智見未來,護航AI”為主題的2024網易易盾AI數字內容風控大會在杭州順利舉行。會上,網易數智旗下網易易盾正式發布面向數字內容風控領域的安全大模型。

“安全是一個需要抬頭創新、低頭深耕的行業。數字內容風控這個網絡安全領域內的細分賽道正在蓬勃發展,這次安全大模型的發布是我們多年來技術和經驗沉淀的‘集大成時刻’。”網易數智副總經理、網易易盾總經理朱浩齊在大會上帶來網易易盾自研安全大模型的首次正式亮相。

專注數字內容風控,網易易盾安全大模型正式亮相

七年磨一劍:為安全范式轉變做準備

在社會學著作《理解媒介》中,思想家麥克盧漢曾深刻、具體地揭示了媒介的影響力。

按照麥克盧漢的理論,媒介信息在很大程度上影響人間事物的尺度變化和模式變化,塑造人的組合方式和形態。因此,媒體是導致社會變動的最強大力量之一。從報紙到電視廣播,再到網絡傳媒與數字時代的新媒體,作為信息和內容的載體,媒介方式隨著技術變革在不斷進化。與此同時,麥克盧漢的理論在逐步得到證實。

數字內容的安全問題不僅沒有隨著技術進步消除,相反,對社會的影響正在逐年上升。

“我們在經歷一場底層安全范式的轉變。信息傳播技術的進步把內容安全問題的重要性升級了,需求端從原先的附加安全發生了到內生安全這一模式轉變。作為服務者,我們不僅需要從理論、技術和工具上做準備,更需要從思維上主動擁抱變革。”朱浩齊在大會上說。

如今,人工智能技術的發展與應用極大地提升了內容生產的效率和質量。通過自然語言處理(NLP)、機器學習、圖像識別等技術,人工智能可以幫助企業自動化地生成文章、視頻、圖像等內容,甚至進行個性化推薦和優化,滿足用戶的多樣化需求。誠然,AIGC為企業與社會帶來內容生產力的成倍增長,但也再次放大數字內容安全的重要性。

從最開始服務于網易內部業務的安全部門到服務外部客戶的完全商業化品牌,網易易盾既有天然的技術優勢,又有豐富的的場景實踐經驗。

同時,多年內外部客戶的持續服務也讓網易易盾擁有了成熟的技術、產品與服務體系。網易易盾面向娛樂社交、游戲、電商、金融、零售、政企等多個行業相繼推出了解決方案,同時秉持“助力客戶內生成長”的服務理念,持續上線AIGC內容安全、出海安全合規、未成年人網絡保護等數十個場景化安全方案。

7年多的時間,網易易盾累計數據檢測量超3萬億,覆蓋終端數超32億,服務客戶審核效率提升超10倍。

專注數字內容風控,網易易盾安全大模型正式亮相

網易易盾既是數字內容風控領域的頭部企業,又是AI時代的先行者。率先參與到從附加安全到內生安全的轉變,并以AI技術為安全業務賦能,給客戶提供更加專業的安全產品和服務,進而推動行業發展——這在網易易盾總經理朱浩齊看來,是義不容辭的責任,也是得天獨厚的市場先機。

因此,更懂數字內容風控的安全大模型正式發布了。

安全大模型:聚焦數字內容風控

在數字內容安全問題治理的過程中,過去很長一段時間,更多的是憑借經驗。

在抖音上這句話能不能發?在小紅書上這個問題能不能搜到?在微博這個話題是否可以討論?然而落到個體對每次具體情況的理解不同,最終體現在安全風控措施的理解上也非常不同。

在網易易盾成立的初期,曾有過一次深入的討論:我們能不能基于我們對各行業實際落地的經驗,去建立各行業內容風控的標準?而在實際落地過程中,發現標準仍還是非常的粗糙,與以往并沒有根本性不同。

大模型的興起和應用,使網易易盾這個想法真正具備可行性。早在2021年,網易易盾就開始著手研究大模型相關技術,通過讓大模型學習理解不同場景下,不同內容的評判結果,讓人工智能去建立各行各業、各個場景中內容風控的研判標準,進而完成數字內容的精細化治理。

在這樣復雜的特定場景中,通用大模型顯然并不能提供符合需求的最優解。

“數字內容風控是安全服務。安全,就要一絲一毫都不能差。我們給客戶提供的必須是我們自己都挑不出問題的完美方案。”朱浩齊講述了帶領團隊開發安全垂直大模型時的原則和思路。

在大模型的“軍備競賽”中,網易易盾雖然有“行業領軍者”的自我要求,卻不急于將不夠完美的產品推向客戶。基于自身業務的特性,從客戶的需求和實際應用場景出發,再到小心翼翼地驗證產品的每一個功能細節,直到反復確認沒有問題,可以解決客戶的問題——網易易盾的大模型之路走的每一步都是穩字當先。

專注數字內容風控,網易易盾安全大模型正式亮相

應用安全大模型的數字內容風控通過大模型對風控尺度的理解,對風險內容實現標簽的自動、精準標識,提升人工審核效率。目前,基于各種場景的測試情況,網易易盾安全大模型已經做到對部分色情疑難樣本召回提升30%以上,助力廣告對抗場景下的違法廣告識別率達到97%以上,AIGC人臉風格化疑難案例的識別率超90%。此外,該安全大模型將風險對抗的時效提升到了小時級,并且輔助真人引流團伙檢出量增長達3倍。

同時,在結合了網易易盾安全大模型的通用大模型問答場景中,基于安全大模型對用戶輸入的語義理解和對風控規則的理解,能夠幫助各類通用大模型對于一些“看上去不好答”的題目,給予準確的回答。除少數幾個極度敏感的議題外,幫助提供開放式問答的模型能夠快速做到“應答盡答”。

以“?!敝巍澳!保篈I時代的長遠藍圖

生成式人工智能的發展始終伴隨著對安全的質疑。

自ChatGPT引爆人工智能浪潮熱點后,世界各國紛紛緊急將生成式人工智能的安全管控上升至重要緊急議題。我國為了促進生成式人工智能健康發展和規范應用,發布《生成式人工智能服務管理暫行辦法》,歐盟理事會批準全球首部對人工智能進行全面監管的《人工智能法案》,美國發布一項名為關于安全、可靠和值得信賴的人工智能(AI)的相關行政令。

綜合世界各國政府部門與頂級智庫對于人工智能安全問題的判斷來看,大模型時代的安全面臨突出的問題在于數據安全、內容安全,其中包括業務安全、供應鏈安全、合規以及道德倫理風險。

其中,在當下以及未來很長一段時間內,內容安全問題會一直是人工智能治理的關鍵挑戰。社會需要關注的是大模型生成,如AI換臉的虛假違規內容被利用為作惡工具,以及幻覺問題、知識模糊、不實新聞等。

專注數字內容風控,網易易盾安全大模型正式亮相

“對人工智能的治理,長期來看,也許需要靠另一個人工智能了?!敝旌讫R表達了對AI時代內容安全問題治理趨勢的判斷,“人工智能給數字內容生產和傳播效率帶來的是幾何倍數級別的增長,對于安全治理的能力提升要求自然也只有人工智能才能滿足。”

安全,不是一朝一夕的事情。尤其是全新技術帶來的既有“已知的未知”安全問題,也有“未知的未知”安全問題。為了解決各種“已知的未知”和“未知的未知”安全問題,網易易盾在大模型的研發思路中應用了新設計的防御理論:內生的彈性縱深防御體系。這個體系中有兩個最重要的設計原則:

一是用時間換精度。這個原則中考慮的并非某個時間點下系統的靜態防御能力,而是需要評估在持續的攻擊之下系統的自我升級能力,其稱之為“自免疫力”。

二是用不確定性提升防御強度。在測試數據變化的情況下,該原則要求通過提升自我保護能力實現系統對多次攻擊的穩定防御。

用大模型治理大模型的數字內容安全,用人工智能對抗人工智能帶來的安全風險。這是網易易盾對未來趨勢的判斷,也是網易易盾正在走的安全技術長征。

本文轉載自:,不代表科技訊之立場。原文鏈接:http://show.wolaioa.com.cn/preview/n3oRnAtLqWyL2Fv02bLgpg.html

陳晨陳晨管理團隊

相關推薦

發表回復

登錄后才能評論
主站蜘蛛池模板: 兴义市| 罗甸县| 松原市| 南安市| 贡山| 渝北区| 礼泉县| 于都县| 皮山县| 平利县| 西充县| 鄂州市| 高密市| 宿松县| 保山市| 富锦市| 天津市| 卢湾区| 钟山县| 盖州市| 滕州市| 宿松县| 玉林市| 丹凤县| 墨竹工卡县| 剑川县| 靖州| 紫金县| 钦州市| 建德市| 甘德县| 鄄城县| 乌海市| 大方县| 西青区| 和林格尔县| 太康县| 新昌县| 屯留县| 富锦市| 高雄市|