
在年初的科技浪潮中,OpenAI發布的Sora視頻生成器以其文生視頻的革命性突破,一度引起全球矚目,被視為好萊塢未來發展的新動力。然而,隨著Shy Kids等藝術家團隊開始深入使用Sora,并公開展示其作品制作過程,關于Sora在實際應用中的真相與挑戰也逐漸浮出水面。
Sora作為一種先進的擴散模型,能夠依據文本提示生成長達一分鐘的逼真視頻內容,并實現鏡頭的切換和構圖調整。然而,當真正將其投入影視制作中,Sora并未展現出最初宣傳中的驚艷效果,而是呈現出一種更加實際和復雜的面貌。
Shy Kids團隊近日在fxguide的采訪中透露,盡管Sora在某些圖像生成方面取得了令人難以置信的進步,但對于復雜的項目,它仍然需要人為指導和大量編輯工作才能滿足導演的具體需求。團隊表示,將Sora融入創作流程是一種創新的工作方式,但并非不可或缺。
在實際操作中,Sora的用戶界面設計簡潔,僅支持文本輸入,這在一定程度上限制了藝術家的創造力。此外,盡管Sora在保持視頻鏡頭內對象的一致性方面表現出色,但系統目前還無法確保不同鏡頭之間的內容完全匹配,這在很大程度上影響了視頻的整體連貫性。
為了盡可能保持一致性,藝術家需要在文本提示中盡可能詳細地描述場景,包括角色的服裝和道具的類型等。然而,即使如此,Sora在鏡頭之間的一致性控制方面仍然存在局限,因為它尚未具備完整的功能集來實現完全的控制。
此外,Sora的隱式鏡頭生成方式也對藝術家的理解力和創造力提出了挑戰。藝術家需要深入理解Sora對特定概念的隱式理解,并基于這些理解來編寫文本提示。例如,在要求Sora生成一個包含香蕉的鏡頭時,藝術家需要考慮到香蕉的隱式特性,如顏色、形狀等,以確保生成的視頻片段符合預期。
總的來說,雖然Sora在視頻生成領域展現出了巨大的潛力,但在實際應用中仍面臨諸多挑戰。隨著技術的不斷發展和改進,我們有理由相信Sora將在未來發揮更大的作用,為影視制作領域帶來更多的創新和變革。
原創文章,作者:AI,如若轉載,請注明出處:http://www.bdzhitong.com/article/653744.html