manyouxianfeng 2017-07-09
选自arXiv
机器之心编译
参与:蒋思源
近日,腾讯发表了一篇介绍并行贝叶斯在线深度学习(PBODL)框架的论文,该论文表示这一框架已经用于腾讯广告系统的点击率预测,并获得了稳定高效的性能。该论文还详细推导展示了 PBODL 框架,并在实际试验中证明了 PBODL 相对于其他在线模型具有更好的表现。机器之心简要地介绍了该论文,具体的推导及试验细节请查看原论文。
论文地址:https://arxiv.org/abs/1707.00802
摘要:我们的论文展示了一种并行贝叶斯在线深度学习框架(PBODL),该框架已经用于如今腾讯广告系统的点击率预测,并提供快速并准确的用户偏好学习方法。我们首先使用了深度概率单位回归模型(probit regression model)解释了 PBODL 框架,该模型在假定高斯密度滤波模式下通过概率性反向传播进行训练。然后我们通过提升这一模型簇的特征嵌入能力而扩展到各种贝叶斯在线学习模型中,如 Sparse-MLP、FM-MLP 和 FFM-MLP 等。最后,我们基于基础计算设备和参数服务器流实现了并行化训练系统。在公共数据集和腾讯产业数据集的试验表明,在我们框架下的模型要比其他一般在线学习模型(如 AdPredictor、FTRL-Proximal 和 MatchBox 等)表现更好。在腾讯广告系统进行的在线 A/B 测试进一步表明我们的框架能更快更准确地学习而实现 CTR 和 CPM 提升。
1. 前言
1.1. 腾讯广告系统
1.2. 相关研究
2. 并行贝叶斯在线深度学习框架(Parallel Bayesian Online Deep Learning Framework)
2.1 贝叶斯深度概率单位模型(Bayesian Deep Probit Model)
图 1:贝叶斯深度概率单位模型
2.2. 嵌入运算层
2.2.1. DimensionAwareSum 层
2.2.3. FFM 层
2.3. 并行训练(Parallel Training)
在高斯情况下,训练工作站和参数服务器流展示在算法 1 和算法 2 中。
上面的框架能解决现实世界中的大数据问题。我们已经将其应用到腾讯广告系统中,并获得了稳定的表现。
3. 试验结果
3.1. 离线(Offline)
3.1.1. Avazu 数据集
3.1.2. Internal 数据集
该数据集有 40 类特征共计 800M 样本。试验结果在表 2 中展示。我们发现在没有进行特征工程下,我们的模型要比其他在线模型表现更优。
3.2. 在线(Online)
4. 说明(Notes)
4.1. 负采样(Negative Sampling)
4.2. Burning
4.3. Prior
4.4. 权重衰减(Weight Decay)
4.5. 强化(Reinforcement)
结论
我们展示了一种并行贝叶斯在线深度学习框架,其已在腾讯广告系统中用来预测广告点击率。在这个框架中,我们介绍了几种新颖的在线深度概率单位回归(probit regression)模型,其在在线试验中相对于其它已知的模型有更好的性能。我们接下来应该在此框架下寻找更多有价值的在线模型。另一方面,我们也会尝试更多的贝叶斯优化方法以取得更好的性能和更稳定的效率。