显著提升平台收入等关键指标,有效逼近理论最优拍卖结果
阿里妈妈生成式拍卖:AI赋能在线广告拍卖机制优化
本文介绍了阿里妈妈展示广告机制策略团队在生成式拍卖(AIGA)方向的研究成果,该研究已发表在KDD’25 Research Track。研究团队提出了一种名为上下文生成式拍卖(CGA)的新型拍卖机制,旨在通过生成式模型优化在线广告拍卖,提升平台收入和广告主收益。
1. 传统拍卖机制的局限性
传统的广义二价拍卖(GSP)等机制依赖于点击率分离假设,忽略了页面中其他商品(外部性)的影响。基于深度学习的拍卖机制如DNA和SW-VCG虽然增强了对高维特征的编码能力,但仍受限于“先预估后分配”的范式,无法捕捉最终分配结果的整页上下文信息(排列外部性),难以达到全局最优。
2. 排列外部性和最优拍卖机制
文章指出,在排列外部性影响下,广告主提高出价并不一定提高最终CTR,传统的单调性假设不再成立。研究团队通过理论分析,证明了即使考虑排列外部性,Myerson最优拍卖的基本形式仍然成立,即分配规则和计费规则可以解耦。
3. 生成式拍卖 (CGA) 的设计与实现
为了高效地解决最优分配问题,CGA采用生成器-评估器架构。生成器使用自回归模型,逐坑位生成广告序列,最大化期望虚拟福利;评估器校准精排阶段的单点pCTR,结合序列上下文信息,为生成器提供奖励信号;计费模块通过优化事后后悔(ex-post regret)学习最优计费规则,保证激励兼容性(IC)和个体理性(IR)。
4. CGA 的模型架构
CGA的生成器包括排列不变性的集合编码器和排列同变性的自回归解码器。集合编码器编码广告embedding序列,解码器使用GRU单元建模广告在坑位的条件概率。评估器使用双向LSTM和self-attention模块提取序列上下文信息,校准pCTR。计费模块通过sigmoid激活函数输出计费比。
5. 训练流程与损失函数
CGA的训练过程将分配求解模块和计费模块解耦。首先训练评估器,最小化交叉熵损失;然后冻结评估器参数,训练生成器,使用Policy Gradient方法最大化奖励函数(包含Self-Reward和External-Reward);最后,使用增广拉格朗日方法优化计费模块,最小化事后后悔。
6. 实验结果与结论
离线实验和在线A/B实验结果表明,CGA显著提升了平台收入(RPM)、CTR、GMV和广告主ROI,同时有效逼近理论最优拍卖的结果。在线实验中,CGA推理时延仅增加1.6%,RPM提升了3.2%。
7. 未来研究方向
未来的研究将探索更高效的生成式架构,以及在拍卖机制中统一分配来自多渠道的商品。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破