(来源:北京大学光华管理学院)
导语
近日,北京大学光华管理学院助理教授王聪与合作者的研究在国际信息系统顶刊Information Systems Research发表的一项研究,探讨了推荐算法出现偏差的原因,并提出了名为DISC的新型推荐框架,为个性化推荐真正贴合用户内在需求提供了全新视角。
行为数据≠真实偏好
在电商平台上,用户的每一次浏览、加购、下单都会留下“数字足迹”,这些数据正是推荐算法的训练基础。但王聪和合作者的研究发现,这些行为数据并非用户真实偏好的纯粹反映,而是多种因素交织的结果。
消费者的购物行为不仅取决于自身对商品的偏好,也会受到商品显式度和从众效应的双重影响。商品显式度如同商场里的显眼广告位,搜索排名靠前、广告投放密集的商品更容易获得用户点击;而从众效应则像货架前的 “人气指标”,高销量、好评多的商品往往能吸引更多人跟风购买。
而传统推荐算法恰恰忽略了这一点,将用户因广告吸引的浏览、因销量跟风的下单,全部等同于“用户喜欢”,直接用于模型训练,这种混淆导致算法陷入越推越偏的循环,既影响用户体验,也降低了平台的推荐转化效率。
提出DISC模型,给行为动因做精准分离
为解决目前推荐算法的问题,研究团队创新性地将因果推断理论融入推荐系统设计,提出了DISC因果解耦推荐方法。该模型的核心突破在于,将驱动用户行为的三大核心因素内在偏好、商品显式度、从众效应精准分离。
具体而言,研究团队基于消费者行为理论,将完整购物旅程划分为三个关键阶段:以浏览为代表的需求识别阶段、以加购为代表的预购评估阶段、以购买为代表的决策阶段。通过构建结构化因果图,模型明确界定了不同因素在各阶段的作用:浏览行为由内在偏好和商品显著性共同驱动,而加购和购买行为则受内在偏好和从众效应影响。
为更加明确地反映真实购物情境,DISC模型引入了潜在变量——决策路径选择变量,成功适配了现实中的复杂购物场景。比如,冲动型消费者可能跳过加购环节直接下单,而谨慎型消费者会完整经历“浏览-加购-购买”流程,这一变量让模型能更精准地捕捉不同用户的决策习惯,避免了传统模型“一刀切”的描述缺陷。
在数据处理层面,由于内在偏好、商品显式度等核心变量无法直接观测,模型通过代理变量间接推断其相对大小,如用商品总浏览量代理显著性,用商品总销量代理从众效应。研究团队通过理论分析证明,在满足宽松假设条件下,该模型可仅基于观测数据,唯一估计出各动因的真实效应,为因果推断的严谨性提供了理论保障。
商业价值落地,反事实分析赋能精准营销
经过在两个大规模真实数据集上的实验验证,DISC模型表现出显著的效果优势:在传统购买行为预测任务中,其预测性能超越当前主流基线模型;在排除显著性与从众效应干扰的“纯净偏好推荐”任务中,该模型能够更准确地预测用户基于内在偏好做出的购买决策,从而实现了对用户真实偏好的精准捕捉。
该模型的核心商业价值在于可基于其学习到的因果图进行反事实分析,为电商平台提供数据驱动的营销决策工具。通过对不同行为动因的干预分析,平台可量化各类营销策略的实际效果:对于冲动型购买路径,提升商品显著性(如优化广告投放、调整搜索排名)的干预效果更优;对于谨慎型购买路径,强化从众效应(如突出高销量数据、展示用户好评)则能更有效促进转化。
这一研究的创新意义在于,打破了传统推荐算法的困境,实现了算法决策的可解释性与可干预性。对于电商平台而言,DISC模型不仅能提升用户粘性与转化效率,还能量化不同动因的干预效果,通过精准匹配降低营销资源浪费;对于消费者来说,未来的推荐列表将更少受到广告、爆款等外部因素的裹挟,更多呈现契合个人真实需求的商品。
随着数字经济的深入发展,个性化推荐已成为连接消费者与商品的核心桥梁。王聪与合作者的这项研究,通过因果推断与推荐算法的深度融合,为推荐系统的优化升级提供了全新方法论,帮助电商行业在精准匹配中挖掘新的增长空间。
注:本篇论文的其他作者还包括复旦大学管理学院石岩松,清华大学经管学院郭迅华,清华大学经管学院陈国青
王聪,北京大学光华管理学院管理科学与信息系统系助理教授。于清华大学经济管理学院取得管理学博士学位,于北京大学信息管理系、国家发展研究院取得管理学、经济学双学士学位,曾在Carnegie Mellon University(卡耐基梅隆大学)从事博士后研究工作。学术研究聚焦于机器学习、数据挖掘等技术方法与管理问题的交叉点上,根据不同管理问题需求及其数据特点进行相应的分析方法设计,以提供精准高效的解决方案。目前主要关注于电子商务、金融科技、智慧医疗等领域的决策支持方法设计研究。研究成果发表于国内外知名学术期刊。