近日,美國OpenAI公司正式發(fā)布文生視頻模型Sora,再次在全球掀起了人工智能關注浪潮。業(yè)內(nèi)人士認為,從當前展示效果來看,Sora顯著領先于其他文生視頻模型,后續(xù)潛在的商業(yè)化有望對短視頻、電影、游戲等下游領域產(chǎn)生深遠影響,并進而傳導到上游算力基礎設施,算力需求有望再次迎來爆發(fā)。
文生視頻探索新高度
美國OpenAI公司發(fā)布的全新的Sora文生視頻模型,可以根據(jù)用戶輸入的文本指令,一次生成60秒的長視頻,且視頻的畫面精細度、流暢度超越了以往的文生視頻模型。由于Sora能夠模擬對世界狀態(tài)產(chǎn)生簡單影響的行為,有分析人士認為,這將文生視頻能力推向了全新的高度。
在Sora發(fā)布之后,有博主對當前市場上其他主流文生視頻產(chǎn)品做了對比評測,在對Sora、Pika、Runway和Stable Video四個模型輸入了相同的提示詞后,Sora在視頻生成質(zhì)量和時間上均對同行“降維打擊”,其更加清晰連貫、符合描述。
在OpenAI官方的技術報告中,對Sora的定位為“作為世界模擬器的視頻生成模型”?!爸皫卓钪髁髂P蜕傻囊曨l時長僅在20秒以內(nèi),Sora不僅能夠深入理解用戶提示,還學會了物理世界的部分規(guī)律,比如:一個人吃漢堡后會留下咬痕、火車車窗上會產(chǎn)生逼真的倒影,Sora還可在單個視頻中設計出多個鏡頭?!比A金證券計算機首席分析師方聞千說。
360集團創(chuàng)始人周鴻祎表示,以往文生視頻軟件都是在2D平面上對圖形元素進行操作,可以把視頻看成是多個真實圖片的組合,并沒有真正掌握這個世界的知識。這次OpenAI利用它的大語言模型優(yōu)勢,讓Sora實現(xiàn)了對現(xiàn)實世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是“真實”的。
業(yè)內(nèi)人士表示,雖然OpenAI表示當前Sora仍有弱點,例如難以準確模擬復雜場景中的物理現(xiàn)象,可能無法理解具體的因果關系,但從當前展示的效果來看,Sora顯著領先于其他文生視頻模型,推動AI視頻生成“進入了一個全新的時代”。
通用人工智能加速到來
目前,Sora暫未公開使用權限,僅對一部分視覺藝術家、設計師和電影制作人開放。業(yè)內(nèi)人士認為,隨著技術的進一步成熟,Sora將會推向所有用戶。Sora預示AGI(通用人工智能)將加速到來,其后續(xù)潛在的商業(yè)化有望對短視頻、電影、游戲等下游領域產(chǎn)生深遠影響。
值得一提的是,日前大火的游戲《幻獸帕魯》的開發(fā)團隊僅有4人,市場猜測該團隊使用了AI生成技術制作游戲角色,以節(jié)省成本。根據(jù)OpenAI發(fā)布的最新Sora技術報告,Sora能夠模擬視頻游戲的數(shù)字化過程。這意味著,開發(fā)制作游戲的門檻可能會被進一步降低。
“有了強大AI能力的加持,OpenAI通往商業(yè)成功之路缺的并不是程序員,而是能實現(xiàn)商業(yè)閉環(huán)的‘金點子’。一旦任務明確,OpenAI就可以很快復制,解決任何能力短板?!敝薪?jīng)社區(qū)塊鏈首席經(jīng)濟分析師郭興華說。
天風證券認為,隨著OpenAI發(fā)布Sora文生視頻模型能力大幅提升,內(nèi)容創(chuàng)作工作流有望被顛覆,下一個億級用戶的互聯(lián)網(wǎng)平臺雛形已然出現(xiàn)。2000億美元的短視頻創(chuàng)作生態(tài)有望率先被顛覆,生成式AI在視頻創(chuàng)作和世界模型領域的大踏步進步將實現(xiàn)對視頻、3D、游戲等下游應用場景的滲透。
此前,A股有不少上市公司曾披露文生視頻有關布局。因賽集團1月26日發(fā)布的調(diào)研紀要顯示,公司的Insight GPT預計于2024年3月底前開發(fā)實現(xiàn)文生視頻功能,之后推出公測版正式啟動商業(yè)化,公司目前已收到幾家汽車、快消行業(yè)知名品牌方發(fā)出的AIGC(生成式人工智能)營銷項目投標邀請。
“Sora的誕生意味著AGI實現(xiàn)可能從10年縮短至一兩年。”周鴻祎認為,Sora只是小試牛刀,它展現(xiàn)的不僅僅是視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破。有了大模型技術作為基礎,再加上人類知識的引導,可以創(chuàng)造各個領域的超級工具,例如在生物醫(yī)學、蛋白質(zhì)、基因研究,物理、化學、數(shù)學的學科研究方面,大模型都會發(fā)揮作用。
算力需求再迎爆發(fā)
業(yè)內(nèi)認為,Sora強大的文生視頻能力將快速推進應用端商業(yè)化落地、拉動產(chǎn)業(yè)規(guī)模,進而傳導到上游算力基礎設施,算力需求將再次迎來爆發(fā)。
據(jù)了解,Sora所需token(文本處理最小單位)數(shù)量相較于文本及圖片模型的推理呈數(shù)量級增長。經(jīng)中信證券簡單估算,對于一個60幀的視頻(約6至8秒),Sora要生成至少約120萬個token,這是相當大的計算量。
“最強AI比拼的終點就是算力。”郭興華表示,為了更快和更好地實現(xiàn)對視頻的渲染和合成,高性能計算機和計算芯片的需求將進一步釋放??萍急ǖ谋澈笮枰懔ε蛎泚砥ヅ?#xff0c;AI芯片將是這場變革中最核心的高地。
OpenAI的CEO薩姆·奧爾特曼表示,正在與投資者進行洽談,旨在提高全球芯片產(chǎn)能,擴大其支撐AI性能的能力,該項目可能需要籌集至多5萬億至7萬億美元資金。奧爾特曼建議,OpenAI、投資者、芯片制造商和電力供應商建立合作關系,共同出資建立芯片工廠。
中信證券表示,本次OpenAI的模型更新仍然是圍繞底層算法層面,除去應用端的投資機會,硬件端的需求也必然會隨著多模態(tài)的技術進步而不斷提升。持續(xù)看好AI算力層面,尤其是得益于商業(yè)端成熟而帶來的更多的AI推理側(cè)算力的機會。
華金證券認為,AI技術的快速發(fā)展催生了算力需求的快速提升,為國內(nèi)外算力產(chǎn)業(yè)鏈帶來了巨大的發(fā)展機遇。邏輯芯片市場空間巨大,國產(chǎn)廠商具有巨大的替代空間。半導體行業(yè)在經(jīng)歷2022年、2023年的去庫存周期后,銷售額有望在2024年迎來復蘇。
相關稿件