
2月16日,OpenAI在社交平臺X上宣布了其全新文生視頻AI模型Sora的誕生。這款模型引發了業界的廣泛關注,被譽為視頻生成領域的GPT-3時刻。
OpenAI Sora核心能力在于其能創建長達60秒、細節豐富的視頻,其中涵蓋了復雜的攝像機運動及多個充滿活力與情感的角色。它不同于傳統的視頻編輯方式,而是通過構建一個虛擬的三維空間,再模擬鏡頭記錄這一空間,從而生成高度逼真的視頻。
360創始人周鴻祎認為,Sora的出現可能將通用人工智能的實現時間從10年縮短至1年。英偉達AI研究院的Jim Fan則從技術層面評價Sora為一個“數據驅動的物理引擎”和“世界模型”,其設計理念領先了行業一個版本。
Sora的成功得益于OpenAI在AI計算效率方面的突破。通過引入與token對應的“Patch”數據單位,OpenAI將圖形語言轉化為對應格式的Patch進行計算,不僅保證了模型的擴展性,還極大提升了單位算力內的運算效率。
OpenAI的每一次創新都似乎能為AI、影視、社媒等行業帶來顛覆性的改變。從ChatGPT到GPT-4,再到如今的Sora,OpenAI的技術積累為其在AI領域的領先地位奠定了堅實基礎。我們期待Sora能為行業帶來更多的驚喜與突破。
原創文章,作者:若安丶,如若轉載,請注明出處:http://www.bdzhitong.com/article/631157.html