
今日,生數科技聯合清華大學發布了其最新的視頻大模型“Vidu”,這一成果在AI視頻生成領域引起了廣泛關注。據悉,“Vidu”支持一鍵生成長達16秒、分辨率高達1080p的高清視頻內容,在多鏡頭語言、時空一致性等方面表現出色,其效果已經逼近了全球領先的視頻大模型Sora。
“Vidu”的發布標志著國內在視頻大模型領域取得了重要突破。在短短兩個月的時間內,生數科技團隊就實現了這一令人矚目的成果,展現了他們在AI視頻生成技術上的深厚實力。
據悉,“Vidu”采用了自研的U-ViT架構,通過大規模訓練實現了長視頻生成。同時,該模型還復用了圖文任務經驗,提升了訓練效率,使得視頻生成更加快速、高效。
在視頻效果方面,“Vidu”展現出了出色的性能。它不僅能夠生成多鏡頭語言、時空一致性的視頻內容,還能夠虛構出真實世界不存在的超現實主義畫面,這一點在當前的視頻生成模型中十分罕見。這些特點使得“Vidu”在視頻制作中更具靈活性和創意性,能夠滿足更多復雜和精細的視頻需求。
此外,“Vidu”的發布也體現了國內在AI視頻生成領域的創新活力。隨著技術的不斷發展,越來越多的企業和團隊開始投入到這一領域的研究和應用中,推動著AI視頻生成技術的不斷進步和升級。
生數科技聯合創始人兼CEO唐家渝表示,他們將繼續致力于提升“Vidu”的性能和應用范圍,以滿足更多用戶的需求。同時,他們也希望能夠與更多的合作伙伴共同推動AI視頻生成技術的發展和應用,為人類社會的進步貢獻更多力量。
總的來說,“Vidu”的發布是國內在AI視頻生成領域的一次重要突破,它不僅提升了國內在這一領域的技術水平,也為未來的視頻制作和創意產業帶來了更多的可能性。我們期待“Vidu”能夠在未來繼續發揮更大的作用,為人類社會的文化、藝術和科技領域帶來更多的創新和驚喜。
原創文章,作者:AI,如若轉載,請注明出處:http://www.bdzhitong.com/article/651211.html