“大模型是人工智能的新時代。對話式的語言大模型是整個人工智能大模型進一步突破的核心。而專業(yè)化的語言大模型,是真正的通用人工智能落地的發(fā)展的核心?!彼急伛Y聯(lián)合創(chuàng)始人、首席科學家、上海交通大學教授俞凱在2023全球智博會上表示。
俞凱作為一名人工智能的從業(yè)者,更是一名研究者,他對目前大模型的行業(yè)發(fā)展和趨勢有著自己的見解?!霸诮邮懿稍L時他表示,以GPT為代表的通用大模型是人工智能發(fā)展的一個集中式突破,包括對話智能技術、深度學習大模型技術、工程化能力以及大數(shù)據(jù)的整體突破。而基礎AI技術創(chuàng)新,必須最終走入產(chǎn)業(yè),結合場景應用才會變得有價值。”
通用模型 助力產(chǎn)業(yè)迭代
以ChatGPT為代表的通用人工智能技術,通過數(shù)據(jù)和算力效能的變化,催生出海量的新商業(yè)模式。而數(shù)字人、個人助理、搜索引擎等應用基于通用人工智能基礎架構的變化,更引發(fā)了產(chǎn)業(yè)創(chuàng)新迭代,俞凱認為其對產(chǎn)業(yè)的影響主要體現(xiàn)在以下四個方面。
首先,通用人工智能技術對搜索引擎產(chǎn)生了革命性變化。搜索引擎之前是通過篩選關鍵詞,推薦給用戶全部答案,讓用戶自行篩選模式?,F(xiàn)在,更傾向于提出一個問題,搜索引擎能直接給出回答,而且這個答案可能比此前的關鍵詞搜索更加豐富、多元。在垂直領域,變化更巨大。比如文獻的搜索衍變成為直接給出更準確、豐富的資料,給用戶提供了更得力的幫助。
其次,通用人工智能技術正在重塑辦公模式,僅僅輸入一句簡短的文字,就能生成初稿;只要提供簡要演示的信息、想要的風格,點擊生成,一份排版精美、動畫豐富的PPT就誕生了……當辦公軟件得到人工智能的加持,人們的工作方式或許會從根本上發(fā)生變化。辦公效率將大幅提升,辦公場景從此改變。
再次,用戶可以應用通用人工智能技術做內(nèi)容創(chuàng)作。無論是生成一篇文章,生成一個郵件,其高效、快速、多風格的內(nèi)容為創(chuàng)新應用拓展、創(chuàng)作成本降低等提供了有力支撐,大模型正在成為內(nèi)容生產(chǎn)的創(chuàng)新引擎。
最后,就是和物理世界的連接。因為通用人工智能技術可以生成代碼,而代碼是連接最基礎的物理設備的基本協(xié)議。當只需要一句話就可以轉成代碼來操作系統(tǒng),人工智能就變成了一個物理操作系統(tǒng)。
俞凱認為,在技術的迭代發(fā)展上,ChatGPT本質就是一個統(tǒng)計類的深度學習對話通用大模型。而思必馳應該算是國內(nèi)最早一批去進行統(tǒng)計類對話模型的產(chǎn)業(yè)化研究的公司之一,并且在任務型對話上也取得了實際的研究成績和應用成績。俞凱表示,思必馳已有的語音和語義的通用基礎模型,已經(jīng)達到億級參數(shù)。在通用基礎模型技術方面,目前思必馳使用千塊GPU卡量級的超算資源,并正在整合擴展資源,在已有算法研究和數(shù)據(jù)積累的基礎上,將億級參數(shù)模型擴展到百億以上量級。
伴隨人工智能技術發(fā)展的,便一直是“AI有所為、有所不為”的討論。俞凱表示,技術本身是中性的,關鍵是運用技術的人,應該向善、不作惡。生成式AI面臨的兩大挑戰(zhàn),一是數(shù)據(jù)合規(guī),包括數(shù)據(jù)來源合規(guī)、數(shù)據(jù)處理合規(guī)、數(shù)據(jù)生成合規(guī);二是應用邊際,包括需要從人員管理上、工程化實現(xiàn)、場景領域上去規(guī)范應用邊界,如何更好地“協(xié)助人類”而不是“替代人類”,甚至是淪為deep fake的幫兇。
涌現(xiàn)能力 加速落地發(fā)展
基于語言大模型的通用對話系統(tǒng)的出現(xiàn)產(chǎn)生了巨大的轉變,在深度學習時代,產(chǎn)生了很多的之前沒有的能力,叫做涌現(xiàn)能力。俞凱表示:“所有涌現(xiàn)能力的產(chǎn)生,一定不是自然而然的,它的涌現(xiàn)能力的產(chǎn)生,‘大’很重要,具有產(chǎn)生新可能,甚至于無窮無盡的可能性,也是大模型‘涌現(xiàn)’的前提條件。”
涌現(xiàn)能力的背后,則進一步隱含著三個非常重要的技術:情景學習、思維鏈和指令學習。情景學習深刻改變了傳統(tǒng)機器學習的范式,只需要通過一系列精心設計的提示語句,對任務進行詳細描述,然后再輔以一些情景例子,就能夠讓模型參考著既定例子完成特定任務。
指令學習則使模型能夠理解并執(zhí)行各種自然語言指令,將任務指令化以便機器理解。人類只需要在少量的任務上進行指令化,在經(jīng)歷大概40多個任務指令化之后,對模型進行適度微調(diào),就很容易泛化到上百、上千種任務,即使它從來沒有見過。而思維鏈則使得模型具有了推理的能力,讓本來模型不會解的一個個復雜問題,分解成很多簡單問題,然后通過逐一解決簡單問題,最終使得復雜問題迎刃而解。
AI技術更不能單靠底層原始創(chuàng)新來推動發(fā)展,其落地應用需要結合行業(yè)認知和客戶需求輸出整體性、結果導向性的實用解決方案。采訪的最后,俞凱說:“希望所有的產(chǎn)業(yè)伙伴和研究伙伴和我們一起共創(chuàng)大模型未來的生態(tài)。讓深度學習的下一代大模型可以在促進數(shù)字經(jīng)濟發(fā)展方面發(fā)揮重要作用?!?/p>
思必馳將于7月12日在蘇州舉辦DFM- 2 大模型及創(chuàng)新技術應用成果發(fā)布會,發(fā)布屬于自己的東風大模型。在發(fā)布會上,思必馳也會詳細解讀DFM- 2 在行業(yè)落地的應用情況,而這款大模型表現(xiàn)如何,我們也拭目以待。
原創(chuàng)文章,作者:蘋果派,如若轉載,請注明出處:http://www.bdzhitong.com/article/572858.html