Skip to content

與800億個訊號共舞

ESSAYS  ✺  YouTube

YouTube 不可能拆開黑盒,公布演算法邏輯只會助長歪風。為杜絕不良創作者刻意操弄,YouTube 演算法經歷兩次重大改版。

YouTube 演算法連繫創作者與觀眾,但其喜好則封閉在黑盒之中,創作者難以理解,所以每當作品被演算法活埋後,都會思疑自己被針對。被針對。我起初也有同樣的疑惑,但仔細閱讀過 YouTube 官方文件博客論文母公司財報專利註冊紀錄相關報道等資料,參透箇中玄妙,並在每日實戰中測試,卻有另一番領悟 –– 演算法就是觀眾,亦即 01011001 01001111 01010101。

YouTube 不可能拆開黑盒,公布演算法邏輯只會助長歪風。為杜絕不良創作者刻意操弄,YouTube 演算法經歷兩次重大改版。2011 年最初的版本以點擊 (Clicks) 和觀看次數 (Views) 為首要,結果平台招惹了大量有名無實的「標題黨」(Clickbait),以失實標題和封面圖欺騙觀眾點擊導流。隨後於 2012 年改以觀看時間 (Watchtime) 為首要,很直觀地假設觀眾看得愈長,愈滿意所獲得的推介,但間接促使了創作者製作節奏緩慢和結構鬆散的影片,損害用戶體驗。首要指標過於清晰,反成漏洞,於是 YouTube 於 2015 年轉以觀眾滿意度 (Viewer Satisfaction) 為首要,並沿用至今。

單從字面解讀,相比點擊、觀看次數和觀看時間,觀眾滿意度顯然更加模糊,是一個由數之不盡的訊號構成的指標。據 YouTube 官方所述,今代演算法同時衡量影片的相對和實際 (Relative & Absolute)的觀看時間留存率 (Retention) ,以判斷影片被點擊後是否適合推介給更多人。此外,今代演算法會衡量觀眾的權重。假設一位觀眾慣性分享影片,演算法則不會太看重這位觀眾提供的訊號。

觀眾滿意度是複雜的綜合指標,是一個不折不扣的黑盒,有效打擊不良創作者的惡意操作。時至今日,YouTube 演算法每天都會從 800 億個訊號學習,並隨用戶的觀看習慣轉變而調節,但萬丈高樓從地起,底層邏輯是永不改變。

隨住攝影器材和教材普及,影片供應有增無減,內容供過於求,市場需要 YouTube 作為聚合器 (Aggregator),整理內容並協調供求雙方。根據 YouTube 官方說法,由 2019 年起 YouTube 每分鐘起碼有 500 小時的內容上傳至平台,而其演算法之一「搜尋與探索系統」(Search & Discovery System) 的目的就是「幫助觀眾找出最有可能觀看的影片,盡可能提升長期觀眾滿意度。」雖說觀眾滿意度是難以捉摸,但若從 YouTube 演算法的本質推敲,則可發現玄機。

YouTube 演算法是一個推介系統 (Recommender System),與交友程式類近,但分別在於,前者配對影片和用戶,後者則配對用戶和用戶。若然交友程式是約會中介公司的經紀,YouTube 演算法則是內容策展人 (Content Curator) ,職責是統籌展覽影片,了解客人的喜好而推介影片,令用戶樂而忘返,明日後日大後日都回來光顧,為公司創造變現機會。若然如此,將心比己,這位策展人的底層邏輯大概有以下六項:

  1. 推介一部很多人都點擊的影片 [曝光次數及點擊率];
  2. 推介一部很多人都看到最後的影片 [觀看時間及留存率];
  3. 推介一部很多人看完後都會讚好、分享和討論的影片 [互動];
  4. 推介一部很多人看完後都會在問卷予以高分的影片 [評分];
  5. 推介一部很多人看完上一部影片後會接著看的影片 [共同觀看 (Co-visitation)]
  6. 推介一部不斷有人湧去觀看的影片 [收視攀升速率 (View Velocity)]。

情人眼裡出西施,情人的相貌如何並不重要,最重要是有人發現他美麗的一面;影迷眼裡出大導,影片是否符合電影美學也不重要,最重要有人願意與它互動。

萬變不離其宗,即使演算法會伴隨 800 億個訊號而千變萬化,人工智能再聰明,都不可能違背上述六項。每當有創作者遇到樽頸時聯絡我,我都會提議他們將坊間流傳的增長技法先拋諸腦後,再引導他們思考上述六項,一邊自我檢討一邊自我探索,配以影片和頻道數據分析,通常都很快找到自己的流量密碼走出窘境。

Next

誰在左右演算法的傾向

演算法下人性的弱點