武磊 LiveVideoStack 2023-08-18 08:15 發(fā)表于北京
編者按:AIGC無疑是當(dāng)下的熱門話題和場景。面對AI帶來的技術(shù)變革和算力挑戰(zhàn),該如何應(yīng)對?LiveVideoStackCon 2023上海站邀請到了網(wǎng)心科技副總裁武磊為我們分享網(wǎng)心在面對AI應(yīng)用場景和業(yè)務(wù)需求下的實(shí)踐經(jīng)驗(yàn)。
(資料圖片)
文/武磊
編輯/LiveVideoStack
大家好,我今天分享的主題是AI重新定義音視頻生產(chǎn)力“新范式”。
分享內(nèi)容主要分為三部分:①AI引領(lǐng)內(nèi)容消費(fèi)升級;②“云”訓(xùn)練“邊”推理是最優(yōu)架構(gòu);③網(wǎng)心的音視頻架構(gòu)演進(jìn)。
-01-
AI引領(lǐng)內(nèi)容消費(fèi)升級
首先是內(nèi)容視頻化。 過去幾年,整個社會的表達(dá)、創(chuàng)作都在視頻化轉(zhuǎn)型與升級。從人類自身來看,大腦處理視覺信息的速度比文字要快60000倍,視覺輔助可以將學(xué)習(xí)效率提高多達(dá)400%。這在科學(xué)層面印證了視頻化敘事的喜聞樂見。從中國整個視頻用戶規(guī)模來看,2010到2022年的12年時間里增長了倍,并于2022年網(wǎng)絡(luò)視聽用戶規(guī)模也正式超越了即時通訊,成為互聯(lián)網(wǎng)第一大應(yīng)用。而移動互聯(lián)網(wǎng)的用戶使用時長更能反映出這種趨勢,2019年短視頻用戶使用總時長還落后即時通訊15%,到2021年已經(jīng)實(shí)現(xiàn)反超,今年5月這一數(shù)據(jù)已經(jīng)擴(kuò)大到%。
第二點(diǎn)是優(yōu)質(zhì)內(nèi)容視頻化效率有待提升。 從網(wǎng)文到漫畫、電影的內(nèi)容視頻化,產(chǎn)生了很多成功的商業(yè)案例。斗羅大陸最早在起點(diǎn)中文網(wǎng)上連載,到2018年點(diǎn)擊量達(dá)到6千多萬,期間也改編過動畫,憑借著廣泛的受眾面,在游戲化后創(chuàng)造了破百億的累計(jì)流水。還有大家熟知的鬼吹燈系列,2015年改編上映的《尋龍?jiān)E》電影,由陳坤和黃渤等主演,票房高達(dá)億,成為當(dāng)年度中國電影票房第三名。
優(yōu)質(zhì)IP的視頻化擁有非常顯著的經(jīng)濟(jì)效益,但從視頻化的效率上來看,還有很多待提升的空間。比如將IP拍成電影,需要經(jīng)歷劇本的打磨、選角、道具準(zhǔn)備、拍攝、后期制作、宣發(fā)、時間和人力上都是巨大的投入。以閱文為例,2022年進(jìn)入IP改編的作品還不到新增作品的%。隨著AI技術(shù)的加入,在劇本、剪輯、配音、特效、宣發(fā)海報(bào)等環(huán)節(jié),都能夠很好地利用AI工具實(shí)現(xiàn)自動化生成,帶來效率提升。
第三點(diǎn)是AI+音視頻的全方位創(chuàng)新。 從圖片、音樂、配音、視頻和交互等各方面已經(jīng)有了很成熟的應(yīng)用。
最近發(fā)生了好萊塢罷工事件,演員和編劇們對于被AI取代的擔(dān)憂已經(jīng)逐漸成為了現(xiàn)實(shí),技術(shù)的革命意味著行業(yè)的洗牌和利益的重新分配。
以游戲制作為例,在AIGC的加持下逐漸構(gòu)建出來了新的創(chuàng)作模式與內(nèi)容價(jià)值。具體來說:1、AIGC可以給創(chuàng)意產(chǎn)生提供思路,同時提升畫質(zhì)和交互性。2、為游戲制作提效。我們都知道《原神》,它從立項(xiàng)到上線測試耗時2年左右,如果在一些環(huán)節(jié)使用AI的確可以提升游戲制作效率,例如網(wǎng)易現(xiàn)在用自研AI技術(shù)應(yīng)用于游戲工業(yè)化全流程,對關(guān)鍵環(huán)節(jié)的工作效率提升多達(dá)90%。3、降本,由于減少了人員和時間投入,可以很好地降低制作成本。4、玩法迭代,助力游戲創(chuàng)新。
來自第三方的調(diào)查數(shù)據(jù)顯示,游戲行業(yè)平均研發(fā)費(fèi)用占收入比例為25%左右,如果用AI的方式,可優(yōu)化制作成本約 266億元 ,40%的研發(fā)成本可以得到優(yōu)化。這里包含了美術(shù)設(shè)計(jì)、自動化測試、音效制作等環(huán)節(jié)。
從文字到視頻,用戶量級呈幾何倍數(shù)的增加。閱文2022年平均月付費(fèi)用戶為790萬人,而視頻應(yīng)用僅愛奇藝一家會員用戶就是過億,抖音用戶更是達(dá)到驚人的億。視頻的特點(diǎn)是內(nèi)容聽得到、看得著、強(qiáng)交互,具有廣覆蓋的用戶群體,從網(wǎng)文到音視頻的轉(zhuǎn)化,網(wǎng)文IP價(jià)值進(jìn)一步放大,隨著AI的加入,生成大量的虛擬人物,產(chǎn)生強(qiáng)互動,為元宇宙的到來奠定基礎(chǔ)。
從文字到音視頻的內(nèi)容消費(fèi)升級,內(nèi)容生產(chǎn)成本從過去的以人工單位定價(jià)轉(zhuǎn)為算力定價(jià)。過去的配音、動漫制作、影視劇制作還是游戲開發(fā),核心的成本還是人員投入。但在AIGC模式下,平均算力成本主要由GPU性能等決定;訓(xùn)練成本與推理成本的比例大約是1:9,以Midjourney為例,大約10%的云成本用于訓(xùn)練,90%是用戶制作圖像的推理。
AI的投入,在帶來生產(chǎn)力質(zhì)的飛躍同時,背后是天量算力的缺口。OpenAI分析表明,2012-2019年,AI訓(xùn)練使用的算力每個月就會翻一倍,相對比摩爾定律是每18個月翻倍,對算力的需求七年增長了30萬倍。而巨大的算力需求背后是高昂的算力成本。以GPT3訓(xùn)練為例,單次訓(xùn)練成本高達(dá)460萬美元,日常運(yùn)營對應(yīng)的單月運(yùn)營成本高達(dá)千萬美元。
-02-
“云”訓(xùn)練“邊”推理是最優(yōu)架構(gòu)
實(shí)際上,邊緣計(jì)算一定不是建設(shè)驅(qū)動和比拼資金密度的行業(yè),基于碎片化的供給,會有很強(qiáng)的平臺效應(yīng)。
網(wǎng)心通過合作招募+自建+共建等方式觸達(dá)到的云、邊、端的資源,這也是網(wǎng)心從2015年一直從各個渠道拓寬觸達(dá)更廣的邊緣資源。有了穩(wěn)定供給的資源,中間一層核心工作是異構(gòu)資源的治理和標(biāo)準(zhǔn)化,通過統(tǒng)一的接入流程,千萬節(jié)點(diǎn)的容器化的平臺支撐,做到資源的合理調(diào)度和高效應(yīng)用。最上層是我們的解決方案產(chǎn)品矩陣,網(wǎng)心當(dāng)前兩大成熟場景: 邊緣計(jì)算平臺和基于邊緣資源的帶寬加速解決方案。
網(wǎng)心的定位是做邊緣云計(jì)算服務(wù)提供商,提供支持未來任何算力的需求場景;在算力場景,我們構(gòu)建了一個健壯,彈性,高可用的基礎(chǔ)設(shè)施平臺,通過智能調(diào)度服務(wù),能夠更加經(jīng)濟(jì)節(jié)省的滿足客戶的AI推理,自動駕駛,工業(yè)互聯(lián)網(wǎng)等場景需求。
我們希望通過提供底層的邊端資源,中心云進(jìn)行模型訓(xùn)練、算法迭代等,得到一個合適的推理模型放在邊緣做數(shù)據(jù)建模。例如,我們最近在和某電動汽車廠商合作,嘗試把智能語音模型推理從云端改到邊端。
接下來講一下新架構(gòu)帶來的變化。
第一、多云融合,需要把中心云和邊緣云的能力進(jìn)行契合,通過探索和實(shí)踐實(shí)現(xiàn)訓(xùn)練和推理的無縫銜接。
第二、資源視圖升級為服務(wù)視圖,我們不僅作為資源提供方,更要親身實(shí)踐,提供相關(guān)的服務(wù)。
第三、邊緣云的多層計(jì)算力分配,將分散、異構(gòu)、多層級、閑置的算力集合起來。
第四、延時降低,交互增加,帶來更多的沉浸式和“臨場感”需求,需要增加相應(yīng)的技術(shù)積累。
在此基礎(chǔ)上,我們提出 IAAS+架構(gòu) 。最底層就是上文提到的中心云與邊緣云的合作,以提供更好的資源管理;中間層通過模型托管平臺,把開源和閉源模型做好銜接;最上層是應(yīng)用層,包括端到端應(yīng)用等。
在AIGC實(shí)踐上。我們嘗試將AIGC中的某些業(yè)務(wù)模塊,所需要的算力從中心下沉至邊緣節(jié)點(diǎn),當(dāng)然目前還是將數(shù)據(jù)回傳至中心存儲,未來希望能直接存儲在邊緣,達(dá)到真正的云邊端協(xié)同。
-03-
網(wǎng)心的音視頻架構(gòu)演進(jìn)
AIGC的爆發(fā)會使更多的內(nèi)容在邊緣產(chǎn)生,同時帶來了低延時的需求。
在直播場景中,需要將一路流拆分成多路,分配到離用戶更近的邊緣節(jié)點(diǎn),在播放端需要這路流時,尋找多個邊緣節(jié)點(diǎn)拉起多路子流合成最終直播流。這個流程目前已經(jīng)相對成熟,無論是在QoS還是QoE方面,都和傳統(tǒng)的方式?jīng)]有太大差異。
目前我們的要求有兩點(diǎn):1、質(zhì)量上與云廠持平,包括流暢度、畫質(zhì)、延時等;2、成本上保證邊緣要服務(wù)80%以上的流量。在關(guān)鍵技術(shù)點(diǎn)上,云負(fù)責(zé)起播和回切,邊負(fù)責(zé)多鏈路傳輸通道以及網(wǎng)絡(luò)傳輸優(yōu)化。
在做雙端優(yōu)化的過程中,我們通過用戶端的網(wǎng)絡(luò)容量評估,實(shí)現(xiàn)對單個鏈路的帶寬分配,通過用戶和每個鏈路之間的實(shí)時質(zhì)量評估以及冗余FEC多通道容錯機(jī)制,盡量減少重傳。
在云游戲中,延時要求更高。接入端和玩家距離越近,延遲越低,網(wǎng)心智能調(diào)度服務(wù)可以根據(jù)網(wǎng)絡(luò)距離實(shí)現(xiàn)最優(yōu)覆蓋,通過調(diào)度返回最優(yōu)節(jié)點(diǎn)列表,實(shí)現(xiàn)更低延遲。
在這里,談?wù)劵赟erverless構(gòu)建邊緣算力服務(wù)。內(nèi)容在邊緣產(chǎn)生,邊緣是一定有用的。內(nèi)容在邊緣分發(fā),超低延時的技術(shù)積累一定有用。
內(nèi)容在邊緣大量產(chǎn)生,就需要把它們組織起來。我們目前的思路是,中心云在Serverless存在實(shí)踐難點(diǎn),而在邊緣云當(dāng)中是剛需,所以需要充分發(fā)揮新業(yè)務(wù)+端+Serverless相結(jié)合的優(yōu)勢。
網(wǎng)心作為全球邊緣計(jì)算創(chuàng)領(lǐng)者,從2015年至今一直深耕邊緣計(jì)算,目前擁有首屈一指的邊緣網(wǎng)絡(luò)資源,而且資源的豐富度和異構(gòu)度是非常充足。
關(guān)于未來網(wǎng)心的業(yè)務(wù)演進(jìn)方向,大致是三步走的策略:
第一步是 降本增效 ,采用更高效的方式、更好的資源配比,助推企業(yè)良性擴(kuò)張。
第二步是 功能迭代 ,在算力場景下不斷積累,逐步探索和實(shí)踐出真正能跑通的業(yè)務(wù)場景和商業(yè)模型。
第三步是 構(gòu)建生態(tài) ,推動邊緣網(wǎng)絡(luò)和算力疊加,對接產(chǎn)業(yè)場景并實(shí)現(xiàn)產(chǎn)業(yè)場景產(chǎn)品化,并構(gòu)建開放網(wǎng)絡(luò)平臺,吸引開發(fā)者、合作伙伴共同構(gòu)建生態(tài)。
以上就是我的分享,謝謝大家!
LiveVideoStackCon是每個多媒體技術(shù)人的舞臺,如果您在團(tuán)隊(duì)、公司中獨(dú)當(dāng)一面,在某一領(lǐng)域或技術(shù)擁有多年實(shí)踐,并熱衷于技術(shù)交流,歡迎申請成為LiveVideoStackCon的出品人/講師。
掃描下方二維碼,可查看講師申請條件、講師福利等信息。提交頁面中的表單完成講師申請。大會組委會將盡快對您的信息進(jìn)行審核,并與符合條件的優(yōu)秀候選人進(jìn)行溝通。
關(guān)鍵詞:

營業(yè)執(zhí)照公示信息