外卖首页列表排序介绍

搜索推荐

数据挖掘机器学习

发布日期: 2022-11-29

作者: ForwardPeng

文章字数: 1.8k

阅读时长: 7 分

阅读次数:

一、产品形态与技术架构

旧首页（2021.4以前）分为商家模式和菜品模式，新首页（2021.6以后）是混排瀑布流

目标
- 流量目标：UV_RPM（千人展示成交额）、UV_CXR（用户维度-转化率）、PV_CTR（卡片维度-点击率）
- 用户运营目标：心智、留存
- 商家运营目标：新店冷启动、品类扶持、KA商家扶持
元素
- 广告卡片：铂金广告、点金广告
- 自然流量卡片：商家卡片、商品卡片、主题卡片

混排服务

商家排序服务

主召回
- XGBoost树模型，对LBS商家打分
- 特征：数量30+，包括user特征、item特征（有限）user-item交叉特征、上下文特征
旁路召回
- 历史行为
- 实时行为
- 向量召回：基于向量相似度的i2i召回（trigger item：实时点击的商家，向量：word2vec训练、用户点击序列训练、同城负采样）
合并
- 各个旁路召回截断后插入至主召回头部，去重后整体截断200个

精排模型演进

机制层整体迭代路径

假设按照pCXR排序，同时要给KA商家做流量扶持
- 方式1：常规商家公式pCXR，KA商家公式pCXR+0.01
- 公式2：常规商家公式pCXR，KA商家公式1.1 * pCXR
明确流量扶持的目的
- 保证扶持对象的曝光量：如主题卡片，带来展示形式的多样化，关注能否给用户曝光到，进而提升对主题场景的认知
- 保证扶持对象的订单量：如KA商家，保证重要客户的单量
问题建模 $\max_{x_{ij}} \sum_{i \in I} \sum_{j \in J(i)} (x_{ij} * CXR_{ij})$ $s.t.$ $\sum_{i \in I} \sum_{j \in J(i)} (x_{ij} * ISKA_{ij} * CXR_{ij}) \ge C^{ka}_{order}$ $\sum_{j \in J(i)}(x_{ij}) = 1, \forall i \in I$ $x_{ij} \in {0,1}, \forall j \in J(i), \forall i \in I$ 其中i:第i个曝光位，I：全部曝光位集合；j：第j个候选，J(i)：第i个曝光位下全部候选集合；$x_{ij}$：第i个曝光位是否曝光第j个候选，0-1变量；$C^{ka}_{order}$：KA的最少成单量。

结论：
- 保订单的扶持：常规商家公式$pCXR$，KA商家公式$（1 + a ISKA） pCXR$
- 保曝光的扶持：常规商家公式$pCXR$，KA商家公式$pCXR+a*ISKA$
简单例子

共2条请求，假设需要保证KA商家曝光（要求2条请求中至少一条曝光KA商家）

	请求1	请求2
KA	10	5
非KA	18	10

a. 公式(1 + a * ISKA) * pCXR：调节系数到a=1.9即可曝光1次KA，总收益10+10
b. 公式pCXR+a* ISKA：调节系数到a=6即可曝光1次KA，总收益18+5

看待排序公式的视角：如何用最小的成本置换
- 单词请求视角：两种公式都是将KA的序往前提，不影响每种商家内部的序
- 全局视角：公式的形式会决定哪些请求适合曝光KA，或者将KA的曝光/订单需求分配到哪些请求
线上效果：目标是扶持曝光，曝光扶持公式 vs 订单扶持公式UV_CXR+0.66%，PV_CTR+0.17%
4.排序公式：多目标
加法公式 vs 乘法公式
- 举例：均衡PVCTR、PVCXR两个目标的时候，以下两个公式哪个好？排序公式1：$apCTR + b pCXR$；排序公式2：$pCTR^{a}*pCXR^{b}$
目标分解到每个曝光位
$PVCTR = \frac{click_count}{expose_count} = \frac{\sum(pCTR)}{expose_count}， PVCXR=\frac{order_count}{expose_count} = \frac{\sum(pCXR)}{expose_count}（假设曝光次数恒定）$
什么样的目标是帕累托最优？
- 两个目标相加是帕累托最优：$a PVCTR + b PVCXR = a \sum(pCTR) + b \sum(pCXR) = \sum(a pCTR + b pCXR)$
- 两个目标相乘帕累托最优：$PVCTR^{a} PVCXR^{b} = [\sum(pCTR)]^{a} [\sum(pCXR)]^b$，乘法目标的情况下不可进一步分解。
分场景个性化调节系数a,b是否有空间？
- 比如高峰期时间段增大pCXR系数，其他时间段增加pCTR系数
简单例子

两个请求，每个请求内：从两个候选中选择一个曝光

a. 公式pCTR + pCXR：两次请求都选择候选1，pCTR总收益5，pCXR总收益为5
b. 公式pCTR*pCXR：两次请求都选择候选2，pCTR总收益4.2，pCXR总收益为4.2