<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 編輯觀(guān)點(diǎn) > 抖音背后的算法推薦邏輯

抖音背后的算法推薦邏輯

作者:陳玲麗 時(shí)間:2025-04-22 來(lái)源:電子產(chǎn)品世界 收藏

推薦已并非新生事物,但圍繞它的爭議卻從未間斷。這些爭議包括推薦帶來(lái)標題黨、低質(zhì)量、甚至虛假內容以及信息繭房的問(wèn)題。很多人對推薦技術(shù)存在誤解,認為算法是給內容打上對應,再給用戶(hù)打上對應的屬性,最后通過(guò)數據運算,把對應的內容推薦給有對應屬性的用戶(hù)。實(shí)際上,隨著(zhù)技術(shù)的發(fā)展,的推薦系統已幾乎不依賴(lài)對內容或者用戶(hù)打,而是通過(guò)復雜的計算,直接預測每個(gè)用戶(hù)對每條內容可能產(chǎn)生的互動(dòng)行為概率。

本文引用地址:http://dyxdggzs.com/article/202504/469675.htm

對推薦算法的主要貢獻在于建立評分系統,在海量算力和海量供給的環(huán)境里,把用戶(hù)行為抽象成數學(xué)里的映射關(guān)系,給用戶(hù)推薦以他為標準的高評分內容的目標。

截屏2025-04-22 13.12.06.png

算法會(huì )圍繞用戶(hù)的反饋建模,有沒(méi)有點(diǎn)贊、看到了第幾秒、寫(xiě)了什么評論、是否點(diǎn)開(kāi)了作者主頁(yè)……等等,這些互動(dòng)都會(huì )讓算法對一個(gè)用戶(hù)的了解逐漸加深,是推薦算法的「北極星指標」,最終越來(lái)越準確的“預測”用戶(hù)行為的發(fā)生率,就是把反饋價(jià)值最高的視頻推給用戶(hù)。這意味著(zhù),在這個(gè)高密度的數據化時(shí)代,算法無(wú)需深入理解內容的具體類(lèi)型或語(yǔ)義,就能高效預測用戶(hù)的潛在興趣和行為。

背后的算法

過(guò)去短視頻平臺的推薦算法是在給內容和用戶(hù)打標簽,然后去做相互匹配,甚至產(chǎn)生了很多教人在養號時(shí)怎么引導系統給自己打標簽的玄學(xué)。然而,標簽機制是人工編輯時(shí)代的經(jīng)驗殘余,是讓算法模仿人類(lèi)的糊涂做法,只有在非常早期的推薦算法里才有用過(guò),當的技術(shù)成熟之后,依靠幾百個(gè)標簽去理解內容的做法就完全被淘汰掉了。

近日,抖音安全與信任中心網(wǎng)站已上線(xiàn)試運營(yíng),公開(kāi)了抖音算法推薦系統的原理、用戶(hù)行為背后的算法推薦邏輯以及平臺人工治理識別各類(lèi)風(fēng)險等內容。當前抖音推薦算法的核心邏輯可以簡(jiǎn)化為“推薦優(yōu)先級公式”:綜合預測用戶(hù)行為概率×行為價(jià)值權重=視頻推薦優(yōu)先級。

截屏2025-04-22 13.13.09.png

推薦優(yōu)先級公式

抖音推薦算法作為人工智能機器學(xué)習技術(shù)的重要應用場(chǎng)景,本質(zhì)上是一套高效的信息過(guò)濾系統。在抖音的實(shí)際應用中,所有在平臺發(fā)布的內容都會(huì )經(jīng)過(guò)評估,流量越高的內容經(jīng)過(guò)評估的次數越多,標準也越嚴格,“人工+機器”審核相互分工又密切配合 —— 機器負責「寬度」評估所有投稿,人工負責「深度」。創(chuàng )作者將內容上傳至后,首先進(jìn)入機器識別環(huán)節:如果內容被識別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問(wèn)題,則會(huì )送至人工審核,若問(wèn)題概率較低,則獲得基礎流量進(jìn)入下一環(huán)節。內容被舉報、評論區出現集中質(zhì)疑、流量激增等情況出現,均可能觸發(fā)再次審核,并導致停止進(jìn)一步推薦和分發(fā)的處置。

抖音基于用戶(hù)行為的推薦方法包含多種技術(shù)模型,如協(xié)同過(guò)濾、雙塔召回、Wide&Deep模型(均為推薦系統中常用模型)等。算法可以在完全“不理解內容”的情況下,找到興趣相似的用戶(hù),把其他人感興趣的內容推薦給該用戶(hù)。

· 協(xié)同過(guò)濾推薦算法是最經(jīng)典的推薦算法,基于內容的協(xié)同過(guò)濾算法會(huì )分析和比較用戶(hù)行為。比如,用戶(hù)A觀(guān)看了內容X、Y、Z,用戶(hù)B觀(guān)看了內容X、Z、W,用戶(hù)C觀(guān)看了內容X、Z、V,算法就會(huì )判定X和Z之間就有較高的相似度,系統會(huì )根據用戶(hù)對已觀(guān)看或已評分內容的偏好,為用戶(hù)推薦與這些內容相似的其他內容。其原理就是,找到和你興趣相似的用戶(hù),把他們感興趣的內容也推薦給你。

· Wide&Deep模型是抖音推薦算法主力模型之一,由Wide部分和Deep部分組成。Wide部分的主要作用是讓模型具有較強的“記憶能力”,模型可直接學(xué)習并利用歷史數據中物品或者特征的“共現頻率”;Deep部分的主要作用是讓模型具有“泛化能力”,能夠發(fā)掘稀疏甚至從未出現過(guò)的稀有特征與最終標簽相關(guān)性。以知識圖譜的跨域推薦,助力信息高效分發(fā)和連接,能夠解決協(xié)同過(guò)濾算法推薦結果頭部效應比較明顯的問(wèn)題。

640.png

當Wide&Deep模型與協(xié)同過(guò)濾算法共同發(fā)揮作用,平臺既可以快速推薦熱門(mén)內容,又能挖掘用戶(hù)潛在的多樣化興趣,讓小眾內容能被更多用戶(hù)關(guān)注。從推薦算法來(lái)看,抖音與國內外大部分內容推薦平臺相似,包含召回、過(guò)濾、排序等環(huán)節,而從數以?xún)|計逐漸減少到數以萬(wàn)計、數以千計,直到篩選出幾條用戶(hù)能夠刷到的內容,一切都要依靠算法的「召回」能力。

如何簡(jiǎn)單地理解「召回」:假設問(wèn)一個(gè)知道結果的球迷“哪支球隊是冠軍”,那么需要猜多少次才能知道世界杯冠軍?「召回」方式是把32支球隊編號,從1到32,然后提問(wèn)“冠軍在1號到16號之中嗎”?如果猜對了,就繼續問(wèn)“冠軍在1號到8號之中嗎”?如果猜錯了,那么就知道冠軍必然在9號到16號之間。這就是數學(xué)模型的本事,它并不需要知道這32支球隊的強弱關(guān)系,卻能以低且簡(jiǎn)潔的成本最大概率「召回」答案。

基于機器學(xué)習和深度學(xué)習構建的推薦算法,提升了超大規模信息分發(fā)、推薦的效率,能交付人類(lèi)難以快速高效完成的任務(wù)。從行為發(fā)生到現實(shí)有效反饋的時(shí)間已經(jīng)非常短,這種近似即時(shí)調整的機制,有助于算法更精準地預判用戶(hù)行為。抖音已經(jīng)實(shí)現了“分鐘級”實(shí)時(shí)反饋更新。

但由于算法是通過(guò)數據收集、特征工程、模型訓練等復雜流程嘗試復刻用戶(hù)選擇的不確定性,其本質(zhì)是數學(xué)模型的運算過(guò)程,而非理解內容本身,因此依然有其局限性。也正是因為這個(gè)特性,抖音曾嘗試直接給知識、歷史、科技等深度內容做加熱,但實(shí)際效果不佳。此舉改變了算法的正常邏輯,會(huì )影響數據循環(huán),導致這些內容的后續推薦受到干擾;此后,抖音轉換思路,針對深度內容訓練,預估收藏和重復觀(guān)看概率的模型,使平臺中的深度內容分發(fā)效率更高。

價(jià)值模型就是對用戶(hù)的互動(dòng)行為進(jìn)行價(jià)值計算,并通過(guò)不斷調整參數,對各類(lèi)價(jià)值進(jìn)行加權,代表了抖音對于哪些動(dòng)作可能更重要的理解。簡(jiǎn)單來(lái)說(shuō),如果僅考慮用戶(hù)交互概率,可能會(huì )造成一些問(wèn)題,比如,一些精心制作的中長(cháng)優(yōu)質(zhì)視頻可能因為完播率較低,而在分發(fā)中處于劣勢地位。通過(guò)對這些因素的深入分析和權衡,「價(jià)值最大化」原則能夠為每個(gè)候選內容計算出反映其潛在價(jià)值的分數,從而為后續的推薦提供有力的依據。

而正是由于算法推送內容的規律性,近年來(lái)在實(shí)踐層面,用戶(hù)對于“反向馴化”算法樂(lè )此不疲 —— 不連續點(diǎn)贊同類(lèi)視頻、不使用平臺搜索記錄、不定期清除瀏覽痕跡,通過(guò)這種刻意制造“數據噪聲”更積極地馴化、制衡算法,主動(dòng)告訴算法自己的需求和偏好,倒逼平臺算法提升推薦服務(wù)水平。

算法大時(shí)代

推薦算法的本質(zhì)是信息過(guò)濾系統,這和信息爆炸的環(huán)境有關(guān)。根據IDC的報告顯示,全球產(chǎn)生的數據量2024年達159ZB,到2028年將達384ZB。需要說(shuō)明的是,1ZB等于10萬(wàn)億億個(gè)Byte,如果以一部約兩小時(shí)的4K電影約20G的大小來(lái)衡量,159ZB相當于7.95萬(wàn)億部電影,連續播放這些電影需要約18億年。這已完全超出了歷史上任何一個(gè)時(shí)代需要處理的信息體量。

抖音每天新增視頻高達億數量級,而普通用戶(hù)平均每天能夠消費的視頻撐死了也就幾百條,那么在這有限的幾百條視頻里,怎么盡可能的確保它們都是用戶(hù)喜歡的,就是算法需要不斷精進(jìn)的母題。不少人將算法視作信息繭房推手,但事實(shí)與之相去甚遠。

信息繭房一詞來(lái)源于美國法學(xué)教授凱斯·R·桑斯坦2006年出版的《信息烏托邦》,指如果人只關(guān)注和選擇自我愉悅的內容,信息接觸面便會(huì )越來(lái)越窄,困于自我編織的繭房中。事實(shí)上,這一概念提出時(shí)并非針對算法,也沒(méi)有實(shí)證研究和量化數據支撐。

截屏2025-04-22 13.16.14.png

社交媒體、搜索引擎等不同網(wǎng)絡(luò )平臺實(shí)際上擴充了用戶(hù)的信息源,不同觀(guān)點(diǎn)的網(wǎng)絡(luò )用戶(hù)集群之間不會(huì )完全隔離,使用戶(hù)接觸到的信息多樣性高于不使用這些平臺的用戶(hù)。但即使是最優(yōu)秀的算法工程師,也無(wú)法脫離算法技術(shù)的種種理論和架構,簡(jiǎn)單解釋為什么把某個(gè)視頻推薦給了這些用戶(hù)而非那些用戶(hù) —— 當每個(gè)用戶(hù)都變成數據里的“點(diǎn)”時(shí),用戶(hù)無(wú)法縱覽全貌,必然極易感覺(jué)身處黑盒當中。

此外,算法治理已成為當今平臺面臨的共同問(wèn)題。中央網(wǎng)信辦以壓實(shí)網(wǎng)站平臺主體責任為抓手,出臺系列政策法規,構建算法備案、安全評估、監測檢查、執法處罰等全流程監管體系,加強算法治理。只有提高算法設計的透明度和算法運行的可解釋性,才能守好算法應用“責任田”。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>