◎智谷趨勢(shì)| 王延鶴
只有視頻化才能生存
隨意打開(kāi)一個(gè)APP,最顯眼的位置,放的都是視頻。
花花世界迷人眼。前100位的APP里,69個(gè)都有視頻類(lèi)功能。
想想看,你每天花多少時(shí)間刷視頻?
根據(jù)《中國(guó)網(wǎng)絡(luò)視聽(tīng)發(fā)展研究報(bào)告(2023)》統(tǒng)計(jì) ,短視頻人均單日使用時(shí)長(zhǎng),超過(guò)2.5小時(shí)。
信息嚴(yán)重過(guò)剩,讓我們的注意力也成為一種稀缺資源。
你把時(shí)間花在哪里,命運(yùn)就在哪里。
懂得這個(gè)道理的企業(yè)和品牌,紛紛開(kāi)始做內(nèi)容、做直播,給產(chǎn)品添加視頻功能。
最樸實(shí)的想法,就是存量競(jìng)爭(zhēng)時(shí),通過(guò)視頻化吸引用戶。
短短5年,中國(guó)短視頻用戶,從6.48億增長(zhǎng)到10.12億;
2022年,中國(guó)視頻直播帶貨規(guī)模約3.5萬(wàn)億,在網(wǎng)上零售額占比高達(dá)25.4%;
出門(mén)逛街,服裝店老板娘、燒烤攤大爺,都架著手機(jī)在直播;
周杰倫辦線上演唱會(huì),有1億人觀看,大家一起唱“故事的小黃花,從出生那年就飄著”;
就連外賣(mài)軟件也在搞直播,看菜品、發(fā)紅包,來(lái)段脫口秀。
在注意力經(jīng)濟(jì)時(shí)代,只有視頻化才能生存。
8月22日,火山引擎視頻云&AIGC技術(shù)大會(huì)召開(kāi)。
大會(huì)主題是“視象新生”,火山引擎作為抖音的技術(shù)底座,要向全行業(yè)展現(xiàn)當(dāng)前視頻創(chuàng)新、變革的源動(dòng)力。
火山引擎總裁譚待認(rèn)為:
隨著全行業(yè)視頻化的演進(jìn),營(yíng)銷(xiāo),知識(shí)、商業(yè)和空間的交互體驗(yàn)也正在被重塑。
意思是說(shuō),視頻從一種內(nèi)容形態(tài),變成必不可少的能力。
過(guò)去三年的現(xiàn)實(shí)困境,讓線上化、視頻化、數(shù)字化,成了必然的選擇。
肉眼可見(jiàn)的,視頻化對(duì)辦公、教育、醫(yī)療、汽車(chē)、金融等行業(yè),帶去顛覆性的商業(yè)創(chuàng)新。
視頻會(huì)議、辦公軟件收獲了億級(jí)增長(zhǎng),頭部辦公APP用戶數(shù)突破6億;
遠(yuǎn)程醫(yī)療發(fā)力,醫(yī)生通過(guò)視頻通話對(duì)患者提供診療,管理患者情況;
智能工廠里,定位、測(cè)量、質(zhì)檢、監(jiān)測(cè)、安全生產(chǎn)都要用到超高清視頻技術(shù)與5G、人工智能的結(jié)合;
24小時(shí)直播的數(shù)字人、大模型定制的AI員工,都開(kāi)始上線;
視頻技術(shù)打破時(shí)空、創(chuàng)造體驗(yàn)、提升效率、轉(zhuǎn)變商業(yè)思維的能力,在本質(zhì)上,也是數(shù)字化革命的一個(gè)切面。
萬(wàn)物皆可視頻化,轉(zhuǎn)變?yōu)閿?shù)據(jù)流。這是機(jī)遇也是挑戰(zhàn)。
火山引擎提前捕捉趨勢(shì),大會(huì)上發(fā)布了自研視頻編解碼芯片、BMF多媒體處理框架等全新技術(shù),以及平行駕駛、虛擬直播間、VR直播等行業(yè)解決方案。
聽(tīng)起來(lái),有些不明覺(jué)厲?別著急。
簡(jiǎn)單來(lái)說(shuō):火山引擎要把抖音的音視頻能力,向全行業(yè)開(kāi)放了。
極限挑戰(zhàn)往往是最好的倒逼師
數(shù)據(jù)是最直觀的。
視頻在全網(wǎng)數(shù)據(jù)流量中的占比接近70%,增速還在攀升。
龐大的視頻直播需求,把視頻云變成了水電煤一般的基礎(chǔ)設(shè)施。預(yù)計(jì)到2024年,就會(huì)成為近千億級(jí)的大市場(chǎng)。
云計(jì)算作為一項(xiàng)商用服務(wù),起源于亞馬遜,電商生意。
至今,亞馬遜還是全球最大的云服務(wù)商,云業(yè)務(wù)是其最賺錢(qián)的部門(mén)。
像亞馬遜和阿里云,為了應(yīng)對(duì)雙十一、黑色星期五期間的流量高峰,儲(chǔ)備了大量冗余算力。
這些服務(wù)器平常閑置時(shí),就可以作為基礎(chǔ)設(shè)施,租借給外部,幫企業(yè)低成本上云,不用自己搞IT。
之后,互聯(lián)網(wǎng)大廠又把自己先進(jìn)的企業(yè)軟件、平臺(tái)能力、人工智能,都通過(guò)云計(jì)算打包成產(chǎn)品和服務(wù),輸出給客戶。
眾多企業(yè)和云平臺(tái)綁定,就形成一個(gè)具備確定性的生態(tài),也奠定了今天的云服務(wù)格局。
在視頻云的細(xì)分賽道,火山引擎最初也是服務(wù)字節(jié)跳動(dòng)內(nèi)部,尤其是抖音的視頻需求。
在2018年,抖音的日活用戶數(shù)超過(guò)1億。
每天要應(yīng)對(duì)視頻播放、傳輸、畫(huà)質(zhì)、交互、性能的多重挑戰(zhàn),內(nèi)部必須要組建能力消化、應(yīng)對(duì)。
真刀真槍的實(shí)戰(zhàn)中,火山引擎視頻云應(yīng)運(yùn)而生。
現(xiàn)在各路企業(yè)都想通過(guò)視頻化,為自己多掙一點(diǎn)確定性。
聽(tīng)起來(lái)容易,但如果企業(yè)自己搭建視頻平臺(tái),首先是成本太高,其次缺乏成系統(tǒng)的成熟經(jīng)驗(yàn),技術(shù)門(mén)檻也比預(yù)想的高。
有需求,就有服務(wù)。這就是火山引擎視頻云的想象空間。
歷史經(jīng)驗(yàn)告訴我們,極限挑戰(zhàn)往往是最好的倒逼師。
春晚、奧運(yùn)會(huì)開(kāi)幕式、世界杯這類(lèi)大型賽事直播,也會(huì)創(chuàng)造短期流量洪峰。
火山引擎視頻云,就在2022年接受了抖音直播卡塔爾世界杯的挑戰(zhàn)。
賽場(chǎng)上,開(kāi)始射門(mén)了。
火山引擎視頻云色彩增強(qiáng)對(duì)比示意圖
這1秒鐘,現(xiàn)場(chǎng)的畫(huà)面通過(guò)衛(wèi)星,從卡塔爾傳輸?shù)街袊?guó),抖音要瞬間將畫(huà)面壓縮、美化,傳輸給數(shù)以億計(jì)的設(shè)備,變成你手機(jī)上的720p、1080p、4K;
這1秒鐘,如果是4K50幀畫(huà)質(zhì),視頻大小接近50M,同時(shí)傳給上億人,線路承受不住。抖音將視頻編碼壓縮到10M,傳給你的手機(jī)再解碼,才避免被流量高峰沖垮;
這1秒鐘,工程師要將HDR信號(hào)轉(zhuǎn)換為SDR,對(duì)畫(huà)面上800萬(wàn)個(gè)像素的色彩、亮度、對(duì)比度進(jìn)行“美顏”;
這1秒鐘,他們要用自研的RTM直播技術(shù),把直播的延時(shí)降到半秒,讓所有人能同步看到比賽結(jié)果;
整場(chǎng)世界杯,火山引擎累計(jì)支持了106億人次的直播觀看,決賽觀看人數(shù)高達(dá)2.3億。
射門(mén)進(jìn)球,全場(chǎng)歡呼。屏幕上是1秒鐘,火山引擎幕后十年功。
這些在流量高峰中突破的技術(shù),也會(huì)逐步開(kāi)放到視頻云的產(chǎn)品里,變成向外輸出的能力。
今天,抖音的日活已超過(guò)6億,2022年抖音電商同比增長(zhǎng)了80%??梢哉f(shuō),火山引擎每分每秒都在極限測(cè)試,不斷解決、試錯(cuò)、交付、迭代。
火山引擎視頻云想向B端企業(yè)證明,自己的增長(zhǎng)飛輪、確定性能力,是可以對(duì)外輸出的。
想要開(kāi)動(dòng)引擎,讓命運(yùn)的齒輪轉(zhuǎn)動(dòng)起來(lái)。
火山引擎到底想輸出什么樣的硬實(shí)力呢?這要看產(chǎn)業(yè)的需求,以用戶為中心嘛。
大會(huì)上提出,視頻技術(shù)面臨三個(gè)難以解決的矛盾:
首先,不管視頻要更高清,還是更低延時(shí),核心都需要升級(jí)視頻編碼技術(shù)。
視頻標(biāo)準(zhǔn)每升級(jí)一代,技術(shù)復(fù)雜度就會(huì)提高十倍;視頻編碼每升級(jí)一代,質(zhì)量碼率則減少50%,但視頻數(shù)據(jù)量擴(kuò)展卻不止2倍;
編碼的迭代速度,追不上視頻數(shù)據(jù)量的增速,這是第一個(gè)矛盾。
其次,摩爾定律變慢了。視頻芯片處理和算力增長(zhǎng)的速度,支撐不了大規(guī)模8K/VR直播和視頻數(shù)據(jù)的需求。
算力有上限,需求無(wú)極限,這是第二個(gè)矛盾。
第三個(gè)矛盾,是XR/VR技術(shù)興起,虛擬現(xiàn)實(shí)與現(xiàn)實(shí)世界融合,將帶來(lái)新的沖擊。
面對(duì)這三大矛盾,結(jié)合眾多企業(yè)的訴求,火山引擎重新構(gòu)建了“一站式音視頻產(chǎn)品矩陣”。
最底座的算力層,是視頻處理的基礎(chǔ)。
視頻需求的快速膨脹,倒逼火山引擎的算力底座,完成了從通用計(jì)算到異構(gòu)計(jì)算的轉(zhuǎn)型。什么意思呢?
什么是異構(gòu)計(jì)算?
好比一支足球隊(duì),隊(duì)員有不同的特長(zhǎng),擅長(zhǎng)不同的攻防位置。
算力也一樣,不同的芯片和處理器,擅長(zhǎng)不同的任務(wù)。比如說(shuō),CPU擅長(zhǎng)通用計(jì)算,GPU適合圖形渲染、深度學(xué)習(xí),FPGA擅長(zhǎng)網(wǎng)絡(luò)加速、數(shù)據(jù)處理。
異構(gòu)計(jì)算就是讓不同的芯片組隊(duì),在應(yīng)對(duì)視頻任務(wù)時(shí),發(fā)揮更高效率。
火山引擎在大會(huì)上發(fā)布的自研芯片,就是一塊擅長(zhǎng)視頻編解碼的芯片。
在處理視頻時(shí),1臺(tái)搭載這塊自研芯片的服務(wù)器,轉(zhuǎn)碼能力與百臺(tái)CPU服務(wù)器相當(dāng);壓縮效率比目前主流的硬件編碼器,提升了30%以上。
并且,這塊芯片提前為未來(lái)設(shè)計(jì),具備支持HDR和8K超高清視頻的能力。
對(duì)企業(yè)來(lái)說(shuō),成本大大降低。
而在框架模型層面,火山引擎聯(lián)合英偉達(dá),共同打造了BMF多媒體處理框架。
這又是什么呢?
簡(jiǎn)單地說(shuō),BMF框架就像一個(gè)裝滿工具的工具箱。
裝滿了視頻化需要的所有技術(shù),比如視頻編解碼、智能處理、視頻分析、圖像生成。
它就是火山引擎過(guò)去3-4年,沉淀的全鏈路視頻能力,目前已投入使用,每天要處理數(shù)以億計(jì)的視頻。
和過(guò)去的視頻處理平臺(tái)相比,BMF的優(yōu)勢(shì)在于:
幫助企業(yè)將各種視頻處理能力和解決方案協(xié)同工作,快速實(shí)現(xiàn)視頻化落地;
支持從生產(chǎn)到消費(fèi)的各種視頻應(yīng)用場(chǎng)景,包括視頻轉(zhuǎn)碼、云編輯、移動(dòng)端后處理,特別是AI帶來(lái)的視頻增強(qiáng)、視頻質(zhì)量分析等功能;
提供多語(yǔ)言開(kāi)發(fā)支持,使開(kāi)發(fā)更加方便,提高效率。
這個(gè)框架已經(jīng)全面開(kāi)源了,包括它的框架層,9個(gè)開(kāi)箱即用的案例,以及超過(guò)20個(gè)API范例。
在應(yīng)用層面,火山引擎的行業(yè)解決方案,就給了開(kāi)發(fā)者拿來(lái)即用、有方法論的視頻化能力。
比如說(shuō),已經(jīng)在抖音落地的互動(dòng)直播營(yíng)銷(xiāo)解決方案。
就把整個(gè)直播鏈路都數(shù)據(jù)化了,這是要教給你,在視頻領(lǐng)域使用數(shù)據(jù)驅(qū)動(dòng)的增長(zhǎng)方法。
讓你一目了然,針對(duì)性增加互動(dòng)、優(yōu)化方式,直接提升直播轉(zhuǎn)化率和營(yíng)收水平。
今年蘋(píng)果推出Vision Pro后,又為VR市場(chǎng)加了一把火;AI大模型的發(fā)展,也為數(shù)字人、虛擬直播的大規(guī)模應(yīng)用,鋪好了路。
火山引擎在Pico VR的實(shí)踐基礎(chǔ)上,打造了8K級(jí)、360度的VR直播全鏈路解決方案。
這降低了VR內(nèi)容的制作門(mén)檻,企業(yè)能在Vision Pro、Pico等設(shè)備里,上線自己的VR應(yīng)用。
而火山引擎專(zhuān)門(mén)打造的虛擬直播間解決方案,也能打造數(shù)字人主播、虛擬直播場(chǎng)景和AR場(chǎng)景。
當(dāng)然,直播技術(shù)是火山引擎的老本行了。除了直播,他們?cè)谶^(guò)去幾年也與行業(yè)合作,打造更加產(chǎn)業(yè)級(jí)的視頻應(yīng)用。
比方說(shuō),自動(dòng)駕駛的核心技術(shù),其實(shí)就是AI、視頻處理、實(shí)時(shí)傳輸。
火山引擎的視頻處理、高速傳輸技術(shù),就很適合與自動(dòng)駕駛公司合作。
將音視頻處理速度提升一個(gè)量級(jí),這就是火山引擎的遠(yuǎn)程車(chē)控方案。
毫末智行與火山引擎共同構(gòu)建的遠(yuǎn)程車(chē)控方案,把汽車(chē)視頻處理速度提升了一個(gè)量級(jí)。
在車(chē)載視頻監(jiān)控、哨兵模式、遠(yuǎn)程理賠、快遞到車(chē)等任務(wù)中,把視頻延時(shí)壓縮到90毫秒,幾乎是實(shí)時(shí)同步了。
這讓自動(dòng)駕駛、遠(yuǎn)程操控,又突破了一個(gè)技術(shù)難點(diǎn)。同樣的技術(shù),也可以用到機(jī)器人、智能制造里,依賴視頻視覺(jué)技術(shù)處理的地方。
再比如說(shuō),今年火遍全球的AI大模型。
近期,火山引擎首次把AIGC視覺(jué)大模型,用來(lái)修復(fù)老電影的。
老電影用膠片保存,時(shí)間久了都會(huì)是“全損”畫(huà)質(zhì)。
所謂修復(fù)工作,其實(shí)就是把膠片數(shù)字化,再一幀幀畫(huà)面“P圖”:清污、補(bǔ)接、處理劃痕、顏色調(diào)整。
一部90分鐘的電影,畫(huà)面有十幾萬(wàn)幀,如果都靠人力P圖,顯然耗時(shí)費(fèi)力、成本高昂。
而通過(guò)視覺(jué)大模型,對(duì)修復(fù)效果實(shí)現(xiàn)了大幅度的提升,并且能規(guī)?;?、高效率進(jìn)行修復(fù)工作。
火山引擎也宣布,要修復(fù)100部香港老片,將《A計(jì)劃》《笑傲江湖》《蜀山·新蜀山劍俠》等經(jīng)典都提升到4K畫(huà)質(zhì)。
可以說(shuō),圍繞視頻化中臺(tái),火山引擎深入了新一代數(shù)字基礎(chǔ)設(shè)施的底座,并與千行百業(yè)建立了關(guān)系,成為一個(gè)扎根視頻技術(shù)的新生態(tài)。
字節(jié)跳動(dòng)視頻架構(gòu)負(fù)責(zé)人王悅表示:
當(dāng)技術(shù)面臨瓶頸,也許我們可以換一種姿勢(shì)奔跑,從算力,體驗(yàn)和交互不同維度突破;
基于抖音等業(yè)務(wù)大規(guī)模實(shí)踐打磨,燃燒沉淀自己,把火種傳遞給更多人。
結(jié)語(yǔ)
現(xiàn)在你知道,火山引擎想輸出什么樣的能力了吧?
在視頻時(shí)代的上半場(chǎng),人們看到了技術(shù)對(duì)娛樂(lè)、電商、社交、教育帶來(lái)的改變。
在如今的下半場(chǎng),變化的是什么?大家需要什么?? ? ??
是線上化嗎?實(shí)時(shí)化?體驗(yàn)感?? ?
本質(zhì),還是效率的提升。
追求效率提升,追求增長(zhǎng),追求穩(wěn)定,這才是大家的共同訴求。
你只要嘗過(guò)甜頭,轉(zhuǎn)變了眼界,才發(fā)現(xiàn)原來(lái)可能性還有很多。
走出一條數(shù)字化路徑后,火山引擎,也想成為確定性的創(chuàng)造者。
相關(guān)稿件