众所周知,YouTube能根据热门视频、历史观看记录以及其他信号向用户推荐他们可能会喜欢的视频。谷歌的一位工程主管克里斯托斯•古德洛(Cristos Goodrow)表示:YouTube观众最常反应的一个问题,是不知道究竟该看些什么,而YouTube视频发现团队的职责正是解决这一问题。
谷歌一直想把YouTube变成更像电视的平台,不但斥巨资打造专业水准的频道节目,还努力增加用户订阅的频道数量——这都是为了将用户的逗留时间从以“分钟”计延长到以“小时”计,从而促进网站广告收入向电视看齐。不过,YouTube现在还没有制作出像Netflix的《纸牌屋》(House of Cards)和《女子监狱》(Orange is the New Black)那样的高人气“神作”。
然而,YouTube首次获得技术艾美奖,却是因为与电视大相径庭的东西——能从海量内容中“沙里淘金”、打造深度个性化体验以延长用户注意力的算法。虽然目前在YouTube上最火的是各种频道,但任何曾经陷在一串串相关视频里无法自拔的人都会说,推荐算法或许才是YouTube的最有价值资产。
用户最爱不相关的“相关视频”
YouTube开始大力向用户推荐相关视频是在2008年,那时它已经问世3年并被谷歌收购了2年。而在YouTube主页以及视频页面右侧推荐其他视频的做法很快就收到了成效——到2008年底,该算法每天都会让用户的观看时长增加数十万小时,而古德洛表示这一数字如今已经以“亿”为单位了。
与此同时,YouTube也学到了一些出人意料的窍门,例如:向用户推荐与他们当前观看内容最密切相关的视频,其实反而会让用户生厌。参与YouTube推荐算法构建的软件工程师海克特•易(Hector Yee)指出:“用户喜欢丰富多样的题材。”
有时候,用户最有可能点击的“相关”视频其实与当前观看内容根本不相关。YouTube视频发现团队在实验中了解到,我们常常在个人兴趣范围内从一个主题跳到另一个主题。
机器学习算法好比“会计记账”
古德洛表示:YouTube构建推荐算法的最大优势,在于掌握了与用户个人喜好相关的海量数据。YouTube既能抓取诸如用户“赞”了哪段视频之类的明确信号,还能抓取诸如用户把哪段视频从头看到尾之类的隐含信号——将所有这些数据综合起来,YouTube就对用户可能会点击什么内容有谱了。
在谈到YouTube使用的机器学习技术时,古德洛将其比作“会计记账”:YouTube的算法会记录用户们观看视频的次序,而当某位用户观看某段视频时,算法会以其他用户看过这段视频后紧接着看了哪些视频为依据,认为该用户可能也会对这些视频感兴趣,从而让它们出现在右侧。
古德洛还表示,YouTube的推荐算法仍有巨大改进空间,而当前一大目标是让用户无需到处点击就能舒舒服服地一段接一段观看他们喜爱的视频、一口气看上30分钟或一小时。
当然,古德洛也承认YouTube除了需要出色的推荐算法之外,也需要出色的视频内容。