如何通过RALM模型框架实现种子人群扩展的思想,达成“准而全”的营销投放述求呢?本文作者通过微信看一看广告资源位场景下的实例,对“Look alike”策略进行了分析,一起来看一下吧。
上篇讲完“look alike”常见的机器学习&深度学习策略,我们今天找个具体在微信看一看广告资源位场景下的实例,更加深切感受一下look alike的策略,如何通过RALM模型框架实现种子人群扩展的思想,如何达成“准而全”的营销投放诉求。
RALM模型框架说明
(资料图片仅供参考)
大体的过程主要分成三个模块,分别是最下层的离线训练、到在线异步处理,再到在线服务。
1. 离线训练离线训练架构图
离线训练,主要包含representation learning(用户表示学习)和look alike learning(用户相似性学习),进行完 look alike learning 之后,可以把 user 经过全连接层的 user 表达 Eu缓存起来。全量用户,有10多亿,可以 catch 到 KV 中。可以提供给在线服务做缓存,线上不用做实时全量传播。
1)representation learning(用户表示学习)
用户表示学习
这个模型有点类似经典的Youtube 的 DNN双塔模型,左侧下班部分是用户的各种Feature,通过embeding lookup 然后再pooling,最后把所有的特征做融合,过一个全连接层就输出了User emedding;右边则是感兴趣的item,也会做embedding生成。最后要预测内容:用户在点击了这么多 item 之后,下一个要点击的 item,最后要预测的就是表达用户兴趣的 embedding。(每个域表示一个行为分布,例如电商下单行为、公众号阅读行为)
2)Look-alike learning(用户相似性学习)
用户相似性学习
一个种子用户需要包含的信息,可以先做假设,种子用户的表达= 共性信息+个性信息。
每个用户都有自己的兴趣,但对整个群体的人群信息存在不同的贡献度,我们称为群体的共性信息:global info。共性信息和目标用户无关,只和用户群体自身有关。种子用户群体的个性信息。种子群体中一定存在一小部分用户和 target 用户兴趣相似,这时,当 target 人群变化时,信息会变化,称为 local info。获取global info的用户的embedding,首先用 global attention,只和 user 相关,和 attention merge 的方法类似,也是一个 self-attention。作用是把种子用户乘以矩阵转换,再乘以种子用户自己,所做的就是捕捉用户群体自身内部的兴趣分布。
local info呢,它的公式是把种子用户的矩阵乘以 w,再乘以 target user 的 embedding,再做一层 softmax,再乘以种子用户自己,这是一个典型的乘法 attention。它的作用是提取种子用户群体中和 target user 相关的部分,捕获种子用户的 local info。是一个用公式得到的这两种 local & global embedding 之后,进行加权和,这就是种子用户群体的全部信息。
2. 在线异步处理在线异步处理架构图
离线训练结束后,是在线异步处理,主要作用是某些可以离线且和线上请求无关的计算,可以先计算完,如更新种子用户。每个 item 候选集都会对应一个种子用户列表,更新种子用户列表,可以每一分钟更新一次,这和访问用户无关,只和候选集的 item 有关。可以实时拉取用户的点击日志,更新点击某个候选集的种子列表,保证种子用户实时性。
可以把 global embedding 预计算 ( gl 只和种子用户有关,是 self-attenion,可在线做异步处理,如每隔一分钟算一次 )。计算 k-means 聚类中心,也是只和种子用户有关,可以提前计算好,如推到推荐系统内存中。所有的东西都是定时更新,不需要线上实时计算。3. 在线服务在线服务说明
线上把聚类中心、global embedding 和所有用户的 embedding 都已缓存好,只需要拉取 user embedding,和候选集的 global embedding 和聚类中心。线上只需要计算 local embedding,是 target user 到种子用户的 attention,这需要根据线上请求的 urn 来实时计算。再计算一次 cosine,就可以得到相似度,这个计算量很小。
4. 最后实验结果在微信看一看上的实验结果
算出 look alike 相似度之后,相似度的分数,可直接给到排序服务,做曝光依据。这是当时原文作者写论文之前做的在线计划 AB testing结果,对比的是用户画像匹配推送的策略,上线之后,在扩大曝光规模的前提下,CTR 基本正向稳定+1.09%(说明获取到了更多相关性的流量),种类丰富性+8.435%,标签丰富多样性+15.938%,说明在扩展过程中同时也获得了更多多样性展开的流量。
Look-alike策略RALM模型的在微信看一看策略大体如上,整体上的思路从用户兴趣特征出发,去探究用户的个性兴趣和人群共性兴趣去探索种子人群的边界,并且在上线实验中也取得了明显的收益效果,通过离线+在线计算的方式保证了种子人群的实时性和效果。
业界还有非常多关于Look alike的论文,我在这里就不一一枚举了,像是阿里妈妈目标人群扩展策略、网易云音乐种子人群扩展策略等等。
和大家一起在策略产品道路上“日拱一卒,功不唐捐”,帮助你成为极具职场壁垒的策略产品,如果有帮助到大家欢迎点赞、收藏以及评论一下。
作者:策略产品Arthur,5年大厂策略产品专家。
本文由 @策略产品Arthur 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
上一篇:国家药监局召开血液制品生产监管座谈会 要求切实履行属地监管责任
下一篇:最后一页
“谢谢选择我做你的妈妈!” 这封信请18年后查收 扬子晚报讯(通讯员 刘威 记者 朱鼎兆)小时候,母亲常常在家里给我们留字条,
跟新冠病毒“赛跑” 他要让机器人完成核酸检测 经常学生们还不知道我怎么想的时候,我就把自己否定了。工作中需要有自我否定的勇气
助力无接触配送 上海无人车“上岗” 【疫情防控新举措】 科技日报讯 (记者符晓波)眼下,上海疫情蔓延趋势得到有效控制,不少
“态靶辨治” 帮助患者快速转阴 近日,随着患者清零,吉林省长春市北湖奥体中心篮球馆方舱医院等多个方舱陆续“休舱”,各医疗队也
四省市联合医疗队为患者全方位“解忧” 【同心守沪抗疫】 在上海城市足迹馆定点医院的宣传墙上,各类慢性病、基础病的健康宣教手
周美亮: 搜寻野生荞麦的“追种人” ◎本报记者 马爱平 一走进位于国家作物种质库新库内的中国农业科学院作物科学研究所研究员
防晒“神器”竟是珊瑚“杀手” 科技日报北京5月8日电 (实习记者张佳欣)珊瑚礁是地球上生物最丰富、最具经济价值的生态系统之一。
X 关闭
X 关闭