关键词:
广告预算分配
非参数学习
渐进最优策略
摘要:
在企业运营环境快速变化,产品迭代速度加快的今天,互联网广告被企业广泛应用于产品营销过程中,特别是在新产品上市时期,广告宣传作为一种重要的营销手段能够向潜在客户提供产品信息,促进消费者产生购买兴趣从而使企业获取更高的收益。为了控制投入成本,企业通常会对一个销售期内的广告预算和可用产品库存进行限制,因此在库存限制下制定有效的广告预算分配策略对于企业决策至关重要。传统的收益管理研究中通常假设营销商已知顾客需求与广告花费之间的函数关系,通过构建收益模型获取最优分配策略,然而在现实中销售情况具有不确定性,企业通常难以捕捉确切的需求函数,而假设需求函数形式利用历史销售数据拟合函数参数的学习方法通常会产生一定的偏差。目前现有的针对广告预算分配问题的非参数学习算法,通过收集广告花费以及对应的销量数据来对需求函数关系进行估计,而本文将销售过程划分为:顾客被广告吸引产生兴趣、将兴趣转化购买行为两个阶段,观察被吸引的顾客到达人数以及实际销量两部分数据,对广告费用影响的到达率函数和购买概率分别进行有效估计,从而更精准地刻画广告花费与销量的关系。本文考虑提出一种非参数学习算法,预先设定一系列广告花费进行测试,观察不同花费下的顾客到达人数以及实际销量,针对广告花费对顾客到达的影响情况以及购买概率进行估计,再利用学习到的函数关系及概率进行广告预算分配决策,制定合理的广告投入以获得更高的收益。在学习阶段的探索过程和广告投入阶段的利用过程中,需要平衡产品的库存约束。针对库存限制下的广告预算分配问题,本文开展了以下几个方面的研究工作:(1)分别构建了不确定需求下的企业期望利润模型以及对应确定性松弛问题下的企业利润模型,构造策略遗憾值的表达式。首先给出了库存约束下广告预算分配问题的场景描述,假设顾客到达过程为泊松过程,提出了泊松过程到达率函数相关性质的假设,构建了库存约束下企业收益最大化的优化模型。其次构建了该问题确定性松弛版本下的优化模型,得到确定性问题最优解的表达式。最后定义策略的遗憾值为策略下的期望收益相对于确定性问题最优值的性能损失。(2)描述了非参数广告预算分配策略的设计思路及算法过程。在学习阶段,算法对一组广告费用进行实验,收集数据对到达率函数和购买概率进行估计,进而得到确定性问题最优解的估计值,在广告投入阶段应用该估计值作为广告费用,得到收益。(3)证明了非参数广告预算分配策略的渐进最优性。首先详细分析了策略对应的遗憾值上界,证明算法能够实现(?)的遗憾值,说明随着市场规模的扩大,遗憾值以较快速度收敛为0。其次通过给出一个到达率函数示例,得到该场景下可能实现的遗憾值下界。(4)通过构造多种类型和不同参数下的的到达率函数应用预算分配策略进行数值实验,得到随着市场规模扩大遗憾值的变化情况,对策略性能的理论结果进行验证,在不同场景下策略性能都得到了保证,说明该策略具有鲁棒性。