近日,ACM國際多媒體會(huì)議(ACM Multimedia 2023)舉辦的社交媒體UGC熱度預(yù)測(cè)比賽(Social Media Prediction 2023)公布了最終成績(jī),其中,網(wǎng)易從全球工業(yè)界和學(xué)術(shù)屆的眾多參賽隊(duì)伍中脫穎而出,超過去年阿里達(dá)摩院創(chuàng)造的記錄,奪得冠軍。據(jù)了解,網(wǎng)易從2017年開始在十余款游戲落地UGC推薦場(chǎng)景,針對(duì)多種UGC場(chǎng)景沉淀了具有業(yè)界領(lǐng)先水平的通用建模方案。
ACM MM(ACM International Conference on Multimedia)是計(jì)算機(jī)圖形學(xué)與多媒體領(lǐng)域的頂級(jí)國際會(huì)議,也是中國計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類學(xué)術(shù)會(huì)議之一。由全球最大、影響力最廣的國際計(jì)算機(jī)學(xué)會(huì) ACM(Association for Computing Machinery)發(fā)起,其評(píng)選的圖靈獎(jiǎng)(A.M. Turing Award)更是計(jì)算機(jī)領(lǐng)域的最高榮譽(yù)。這一榮譽(yù)的取得,不僅證明了該團(tuán)隊(duì)在推薦算法技術(shù)領(lǐng)域的卓越能力,也進(jìn)一步展示了網(wǎng)易在推動(dòng)AI技術(shù)應(yīng)用方面的領(lǐng)先地位。
本次賽題是社交平臺(tái)多媒體UGC內(nèi)容的熱度預(yù)測(cè),涵蓋了照片、用戶信息、圖像、文本、時(shí)間等多模態(tài)信息,對(duì)技術(shù)要求跨越了自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)、推薦系統(tǒng)(REC)等多個(gè)領(lǐng)域,對(duì)技術(shù)儲(chǔ)備是個(gè)不小的挑戰(zhàn)。面對(duì)這一挑戰(zhàn),網(wǎng)易憑借多年在UGC業(yè)務(wù)中的技術(shù)積累和方案打磨,將業(yè)務(wù)中積累的算法模型遷移到比賽中,從比賽伊始就一路領(lǐng)先,最終獲得了冠軍的殊榮,且相關(guān)論文也被會(huì)議接收,彰顯了卓越的技術(shù)實(shí)力和創(chuàng)新能力。
在游戲領(lǐng)域,UGC 可用于擴(kuò)展游戲體驗(yàn)、提高用戶參與度和留存率,是一種具有成本效益的營銷形式。豐富、與眾不同、個(gè)性化的UGC內(nèi)容,不僅能夠滿足用戶多樣化的需求,也使產(chǎn)品更具吸引力和互動(dòng)性,更能增加用戶黏性。玩家自制的內(nèi)容不僅能讓現(xiàn)有的用戶持續(xù)體驗(yàn)到新鮮感而留存,還能在社交平臺(tái)上進(jìn)一步擴(kuò)散,吸引更多潛在用戶。
對(duì)于UGC推薦,他們將問題理解為以下幾個(gè)方面:
- 玩家體驗(yàn)和作者體驗(yàn)的平衡:從玩家體驗(yàn)的角度出發(fā),分發(fā)的應(yīng)該是最熱門的內(nèi)容和最符合玩家偏好的內(nèi)容。然而,對(duì)于一些作者的新作品,由于缺乏歷史數(shù)據(jù),難以確定用戶是否會(huì)喜歡,因此不會(huì)將其直接分發(fā)給用戶。這種做法會(huì)導(dǎo)致嚴(yán)重的馬太效應(yīng),使新的優(yōu)質(zhì)內(nèi)容難以成為熱門,也無法激勵(lì)作者,不利于長遠(yuǎn)發(fā)展。
- 多模態(tài)特征的重要性:UGC內(nèi)容以絢麗的Feed流形式呈現(xiàn)給用戶,一張卡片所能承載的信息有限而珍貴。除了常見的標(biāo)題、作者、簡(jiǎn)介等文字信息外,還蘊(yùn)含著推廣圖、快照短片等引人入勝的圖片信息,主題音樂等音頻信息,以及點(diǎn)贊數(shù)、瀏覽數(shù)等統(tǒng)計(jì)信息。然而,僅憑統(tǒng)計(jì)數(shù)據(jù)和用戶行為序列這些容易建模的信息,我們只能勉強(qiáng)揣測(cè)用戶的喜好。這種粗略推斷既無法充分發(fā)掘UGC內(nèi)容的潛能,又容易受到馬太效應(yīng)的限制,無法真正“激活”未被挖掘的優(yōu)秀內(nèi)容。
- 內(nèi)容冷啟動(dòng)的難點(diǎn):毋庸置疑,卓越的內(nèi)容必須獲得足夠的曝光,方能充分驗(yàn)證其卓越之處,并找到那些真正喜歡它的用戶。那么,我們是否可以通過冷啟動(dòng)的方式為其提供曝光呢?然而,曝光流量可貴無比,給予過多的冷啟動(dòng)機(jī)會(huì)可能導(dǎo)致內(nèi)容受眾的減少,直接影響用戶體驗(yàn),更不用說某些敏感玩家只是試探性地探索一番,若未能吸引他們,他們很可能會(huì)迅速離開。因此,除了前文提及的文字、圖片、音頻等內(nèi)在信息可用于冷啟動(dòng)之外,還必須考慮用戶特征以及在短暫曝光后對(duì)內(nèi)容曝光的增加或降低,以及曝光應(yīng)更多面向哪個(gè)群體。所有這些要素都必須被充分考慮,方案的復(fù)雜度呈指數(shù)級(jí)上升。
- 分發(fā)多樣性的必要性:為了實(shí)現(xiàn)長遠(yuǎn)發(fā)展,不僅需要給與用戶當(dāng)下最滿足需求的內(nèi)容,還需要提供多樣化的內(nèi)容選擇,豐富用戶的閱讀和觀看體驗(yàn)。用戶不再局限于熱門內(nèi)容,而是能夠發(fā)現(xiàn)更多風(fēng)格各異、獨(dú)具特色的作品。這種多樣性不僅能夠滿足用戶的個(gè)性化需求,也能夠拓寬用戶的視野,讓他們體驗(yàn)到更多不同領(lǐng)域的精彩內(nèi)容,提升用戶的長期體驗(yàn)。
- 數(shù)據(jù)的稀疏性:數(shù)據(jù)稀疏性呈現(xiàn)出雙重維度的挑戰(zhàn),即用戶行為的稀疏和UGC內(nèi)容的反饋稀疏。這種稀疏性使得我們難以準(zhǔn)確揣摩用戶的偏好,也讓一些卓越作品黯然失色。為了克服數(shù)據(jù)的稀疏性,我們需采用創(chuàng)新的數(shù)據(jù)采集和分析方法,結(jié)合實(shí)時(shí)用戶反饋和行為數(shù)據(jù),甚至在游戲業(yè)務(wù)中善用其它場(chǎng)景的用戶行為。借助這些手段,我們能以更迅速、更全面的方式洞察用戶需求,為他們提供更加豐富、個(gè)性化的內(nèi)容推薦。當(dāng)我們克服數(shù)據(jù)的稀疏性時(shí),才能真正激發(fā)卓越作品的潛能,提升整體用戶體驗(yàn),推動(dòng)UGC平臺(tái)踏上可持續(xù)發(fā)展之路。
網(wǎng)易自2015年起,一直致力于在游戲中利用數(shù)據(jù)智能技術(shù)改善玩家體驗(yàn),在精細(xì)化運(yùn)營、個(gè)性化推薦技術(shù)領(lǐng)域助力上百款產(chǎn)品實(shí)現(xiàn)營收增長。 對(duì)于UGC業(yè)務(wù),他們已經(jīng)沉淀了一套高效的接入方案, 當(dāng)前接入的業(yè)務(wù)涉及UGC地圖推薦、社區(qū)帖子推薦、UGC外觀推薦、直播推薦等,均在參與率、游玩時(shí)長等指標(biāo)上獲得提升。